http://homepage2.nifty.com/AnoSoft/dwnload.htm
MS-WordやExcelやPowerPointを全文テキスト検索するソフトなどのダウンロード
使った事はないのですが,こういうのは使えませんかね.
(上司は何にも分かってないタコなので,本気で怒っても自分が辛いだけっす.畑のキャベツやかぼちゃに怒ってもしょうがないです(^^;)
PDFからTextに変換するのはいかがですか?
そこからGREPしてみるといいかもしれませんよ
Acrobatにも書き出す機能があったとは思いますが
これもいいです。使えそうです。
KWIC Finderというシェアウェアで前文検索できるようなので「@」や「.jp」「.com」を検索してみてはいかがでしょうか。
これもよさげです。俺は何も知らなかったんだなぁ
http://www.forest.impress.co.jp/article/2003/07/28/kwicfinder.ht...
窓の杜 - 【Review NEWS】TXT/PDFファイル、Office文書、電子メールなどを全文検索「KWIC Finder」
http://arena.nikkeibp.co.jp/qa/other/20020603/100595/
PDFを利用して文書管理するには - デジタル - 日経トレンディネット
http://www.zdnet.co.jp/news/products/9908/19ask.html
競争力向上にITを活用するすべての企業へ - ZDNet Japan
結構あるものなんすね。。
Namazu: a Full-Text Search Engine
追加です。
検索エンジンNamazuです。
社内にWebサーバーを立てそれを使ってNamazuで全文検索をするというのも1つでしょうか。
Acrobatで読んで、テキストを選択、コピーして、テキスト化して、それから、このサイトで
メールアドレスを抽出してはどうでしょう?
うほっ
pdfファイルがいっぱいあるんです。
おっしゃるようにpdfをtxtにしてgrep書けるというのでいかがでしょうか?
pdf2txt version 0.95
日本語PDFファイルから日本語テキストを抽出するPerlスクリプト
PDFファイルからテキストを取り出すPerlスクリプト。
http://www.hatena.ne.jp/1061383401
PDF文書をテキストファイルに変換したいのですが、どうしても文字化けが発生してしまいます。今までに試した方法は1:Acrobat Readerのテキスト選択ツールからコピペ 2:PDF.. - 人力検索はてな
過去にも同様の質問があります。
PDFからテキストを抽出する方法
http://www.geocities.co.jp/SiliconValley-Bay/1992/tips/pdf2text....
PDFからテキストを抽出する方法 (Hajilyn's Papa)
ありがとうございます。
直接の回答になっていませんが、PDFからテキストを抽出してから、grepで検索すれば良いかも知れません。
namazuという全文検索ソフトでは、その目的のために、Xpdfに付属のpdftotextを使って、テキストの抽出を行う事が紹介されていました。
http://www.verypdf.com/pdf2txt/pdf2txt.htm
PDF to Text - convert Adobe PDF documents into ASCII text format with PDF to Text converter, royalty free SDK product
名前からするとPDFからテキストを抽出するソフトの様です。
こちらも同様。
ぉおお。こんなのあったのかぁ