« 下4桁一致 | トップページ | 2週間で8センチ »

2009年2月 8日 (日)

ココログをNamazuで検索

どうもGoogleカスタム検索では満足できないので、結局、Namazuを使うことにした。完成した検索サイトはSorry, Wrong Access全文検索。もちろん、ココログではCGIは使えないので別サーバーにNamazuをインストールするか、pnamazuを使うことになる。問題は1記事1ファイルにしなくてはいけないこと。FTPが使えれば簡単だが、使えないので1カ月分のバックナンバーファイルをダウンロードし、秀丸のマクロで切り出した。

月別のバックナンバーファイル(index.html)はそれぞれ年、月のフォルダ(例えば、c:\cocolog\2009\02とか)に入れ、サーバーのファイル構成と同じにしておく。で、index.htmlを秀丸で開いてマクロを実行する。マクロはこんな感じ(http://sundance.txt-nifty.com/doc/cocolog.txt)。ファイルの中にあるURLからファイル名を取り出し、その名前で保存するのがポイント。ココログのファイル名は不規則で、このサイトの場合、以下のように4パターンあった。

http://sundance.txt-nifty.com/blog/2009/02/post-f861.html      
http://sundance.txt-nifty.com/blog/2009/01/walle-f7d7.html      
http://sundance.txt-nifty.com/blog/2009/01/007-3267.html      
http://sundance.txt-nifty.com/blog/2008/07/dreamweaver_cs3.html

一番多いのはpost-.*htmlのパターンで、これに統一してくれれば処理は楽なんですけどね。仕方がないので、2009/02/post-f861.htmlの文字列を取り出し、2009/02/を取り除いてファイル名を付けるという処理にした。この処理はPerlやRuby、なでしこなど正規表現が使えるプログラム言語なら何でもできるでしょう。

あとはNamazuでインデックスを作るだけ。.namazurcでReplaceの設定をしておけば、検索結果からココログの該当ファイルにリンクできる。Namazuだと、ブログを更新するたびにインデックスを作らなくてはいけないが、1週間とか10日分はトップページに表示されているので、それぐらいの間隔で作れば良いのではないか。Perlに詳しい人ならダウンロードからファイルの切り出しまで自動で行うスクリプトを書くかもしれない。

あと、ココログのファイルはUTF-8なので、検索ボックスから検索すると、文字化けする。Namazuが対応していないのだ。なので、namazu.cgiに検索キーワードを渡す途中にCGIでSJISかEUCに変換しなくてはいけない。namazuでUTF8ファイルの検索などが参考になるが、この例はICONVを使っている。僕はJcodeで処理するCGIを書いた。

なお、日記の方になでしこでココログのファイルをダウンロードする方法を書いた。なでしこを使った方が処理は速かった。

|

« 下4桁一致 | トップページ | 2週間で8センチ »

パソコン・インターネット」カテゴリの記事

コメント

またhiroさんが何語をしゃべっているのか判らない

投稿: 45 | 2009年2月 8日 (日) 09時05分

昨日は家内がいなかったので、ずっと、これやってました(^^ゞ
ココログって不自由な部分も多いんですが、不自由さを何とかしていくのも面白いです。

先日、45さんにGoogleのBloggerのことを聞いたのはあれだと、自分のレンタルサーバーにファイルを転送できるからなんです。自分のサーバーにファイルがあれば、検索させるのは簡単なんですよ。

投稿: hiro | 2009年2月 8日 (日) 09時26分

hiroさん・・・・・うわぁー♪
そんな風にhiroさんが普段に私のことを考えてくれたーなんてことは嬉しいのですが、ブロガーのブログはほんんんんんんんんんとに秘密のブログですから大変なことになりますです

私がいつか芥川賞作家にでもなったらお願いします

投稿: 45 | 2009年2月 9日 (月) 07時44分

すみません、45さん、ちょっとした誤解があるようで(^^ゞ
45さんのブログを検索させるのではなくて、僕のブログを検索させるのが狙いなのです。
でも芥川賞作家になったら、45さんのブログも検索できるようにします。って、BloggerだからGoogleで検索すればいいんですけどね。

投稿: hiro | 2009年2月 9日 (月) 21時59分

24時間受付中! BELL & ROSS ベル&ロスの新着商品や、GMTおすすめのBELL & ROSS ベル&ロス一覧、BELL & ROSS ベル&ロスの人気ランキング等、様々なカテゴリで絞り込んだ商品一覧から、あなたにぴったりのBELL & ROSS ベル&ロスをお探しください。
掲載商品は店頭販売もしている関係上、ご注文手続きを頂いた時点ですでに販売済みになっている場合があります。
ステンレススティール製のブレスレットも細かく微調整ができますので装着感も非常に良いモデルですのでご来店の際には是非、ご試着してみてくださいませ。
時計専門店だし、ちゃんと値段を付けてもらえると思ったからです。
時計の状態が不安な場合は買取業者に事前に確認してみよう。
【おめとめ査定について】おまとめ査定で買取価格がお得になります!昨年デビューしたベル&ロスの角形ダイバーズは、ブランドのアイコニックなデザインを守りつつ、本格機能を実現し、高く支持されている。
他に”BR03-94”ファントムクロノが250,000円位となっていますが、これらの価格はその時の状態にもよるのなのでご注意ください。
ベル&ロスはその機能性の高さが最大の特徴ですが、デザイン性においても非常に高い時計が多いことも大きな特徴だと言えます。
またベル&ロスの時計は製作に当たって全工程をスイスで行っており、 細かな部分までしっかりと品質管理がされているため、機能性が高いだけでなく時計の品質が高いことも1つの大きな特徴だと言えます。
ベル&ロスといえば四角いケースの時計というイメージの方も多いですが丸いケースのヴィンテージシリーズも非常に人気が高くお問い合わせも非常に多いシリーズです。
このようにベル&ロスでは機能性が高いというだけでなく、見た目に関しても非常に優れた時計であるのです。
そのデザイン性は斬新で、一目見てベル&ロスと認識させる一貫性があります。
個性的なスタイルのミリタリーウォッチとして、航空機の計器に通じる大型で視認性の高いデザインが特徴です。
比較的中古市場でも数は少ない方なので、未使用か未使用に近い中古品を手堅く狙うのが、賢い購入法と言えるであろう。

その他の世界一流スーパーコピー https://www.cocoejp.com/ProductList1.aspx?TypeId=568839025999364

投稿: その他の世界一流スーパーコピー | 2020年6月 1日 (月) 17時57分

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: ココログをNamazuで検索:

« 下4桁一致 | トップページ | 2週間で8センチ »