Google Desktop Search と透明テキスト付き PDF
- ■ はじめに
随分前に導入した Google デスクトップですが、PDF ファイルの検索機能に問題があるのでは…と感じていました。
雑誌の記事などをスキャナーで読み込み、検索できるように透明テキスト付き PDF として保存していますが、
ごくわずかしかヒットしません。
その割には、検索対象を制限していなかったこともあり、随分とインデックス・ファイルを作成しています(2GB 余り)。
ガジェットでニュースや天気が表示されるのはいいのですが、
そのために Cドライブを 2GB も占有されるのはたまらないので削除してしまいました。
たまたま、「使ってはいけない:Googleデスクトップサーチ」
というページを拝見して、透明テキストの検索にはプラグインが必要なことを知りました(感謝)。
Google のページ「アイテムを検索できない: PDF ファイル」
を見ると、「ドキュメントでクリア テキストまたは透明テキストを使用している。」という分りやすい記述がありましたが、
私が以前確認したときにはなかったように思います。
- ■ TweakGDS
検索プラグインの前に…。もともと容量が小さい Cドライブではなく他のドライブにインデックス・ファイルを作成するガジェットです。
http://desktop.google.com/plugins/i/tweakgds.html?hl=ja
から入手できます。
- 起動したら、左ペインで [Indexing] を選択し、(表示されるドライブリストにはチェックを入れずに)[Delete Cache]
をクリックすると、キャッシュがクリアされました。
- 次に [Index Location] を選択し、[To change the index location.] の [click here] をクリックして、変更先の保存フォルダを指定しました。
- ■ GoogleDesktopSearch★Xdoc
Google Desktop Search で一太郎や OASYS などの文書を検索するPlugInです。
http://softfarm.net/ather/xdocgoogle.html
が作者のページのようです。
- ダウンロードしたファイルを解凍し、その中の SoftFarmXdocFileIndexer.conf を編集しました。
#Microsoft WORD 2007(OOXML)
AddNewExtension "docx"
#Microsoft Excel 2007(OOXML)
AddNewExtension "xlsx"
#Microsoft PowerPoint 2007(OOXML)
AddNewExtension "pptx"
# Adobe PDF
AddNewExtension "pdf"
上記以外はコメントアウトしました。
Google デスクトップで、これ以外のファイルはインデックスを作成しないよう制限したからです。
- 解凍したフォルダ名を GoogleXdoc と変更して、丸ごと
Google デスクトップがインストールされたフォルダ(C:\Program Files\Google\Google Desktop Search)に移動しました。
- xdoc_dllregist.exe を実行すると、「インストール」か「アンインストール」か聞いてくるので「インストール」を選択。
以上で完了です。しばらく待てばインデックスが作成され、無事ヒットするようになりました。