fc2ブログ

Namazu で PDF取扱い その2

Namazu での PDF 取扱いに成功しました

PDFファイルを検索対象とする
を参考に行ってみました

NamazuでPDFを検索対象とするにはxpdfといったソフトウェアが必要らしいです

まず xdf をインストールします
wget ftp://ftp.foolabs.com/pub/xpdf/xpdf-3.02.tar.gz
tar xzvf xpdf-3.02.tar.gz
cd xpdf-3.02
./configure
make
make install

次に、xpdf-japanese をインストールします
wget ftp://ftp.foolabs.com/pub/xpdf/xpdf-japanese.tar.gz
mv xpdf-japanese.tar.gz /home/wiki/
cd /home/wiki/
tar zxvf xpdf-japanese.tar.gz
cd xpdf-japanese
mkdir -p /usr/local/share/xpdf/japanese
cp -R * /usr/local/share/xpdf/japanese/
cat add-to-xpdfrc >> /usr/local/etc/xpdfrc

これで、pdf が検索可能になりますが、
拡張子に .pdf がついていないと検索できませんでした

ためしに、.pdf がないファイルを検索してみましたが
検索できませんでした

どうやら、拡張子で検索しているようです

mknmz -C | grep pdf
で、成功しているかどうかがわかります

mknmzrcファイルに pdf を検索対象として加えるには
サイト内検索システム構築(Namazu)
をもとに行っているなら

$ALLOW_FILE = ".*\\.(?:$HTML_SUFFIX)";

の部分を
$ALLOW_FILE = ".*\\.(?:$HTML_SUFFIX)".
"|.*\\.pdf|.*\\.ps";
とすれば、検索対象になります

もっとも、まだこの段階では、cgi 検索(ブラウザでの検索)
のときに問題が残っているので、解決したらまとめようと思います

スポンサーサイト



テーマ : Linux
ジャンル : コンピュータ

コメント

非公開コメント

最新記事
検索フォーム
GREEハコニワ攻略サイト
リンク
カテゴリ
月別アーカイブ
フリーエリア
最新記事
FXプライムレート
最新コメント
最新トラックバック