1万個のURLが書かれたテキストファイルの中から、404や403などのエラーでアクセスできないURLを除去し、アクセスできるURLのみにする方法はありますか?


テキストファイルは、1行に1URLです。Windows XPを使用しています。CygwinとPHPも入っているので、コマンドなどを使ったやり方でも結構です。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:
  • 終了:--
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

回答4件)

id:kanetetu No.1

回答回数2199ベストアンサー獲得回数11

ポイント18pt

http://mac-news.net/soft/mac-html.html

Mac WWW/HTML Making Softwares

Big Brother が便利ですよ。

テキストの正規表現でHTMLにし

このソフトを利用するといいですよ。

id:hkn

ありがとうございます。Cygwinで動くということですかね? 調べてみます。

2005/08/25 12:40:37
id:nkysn No.2

回答回数10ベストアンサー獲得回数0

ポイント18pt

http://web.paulownia.jp/script/ajax/xmlhttp2.html

web.paulownia.jp - XMLHttpRequestの使い方2

Wsh(VBscript)の例ですが、xmlhttpオブジェクトを使えば、statusプロパティにレスポンスコードが

返されます。


Set xmlhttp = Wscript.CreateObject(”Microsoft.XMLHTTP”)

xmlhttp.open ”GET”, ”http://www.yahoo.co.jp/”, false

xmlhttp.send()

msgbox(xmlhttp.status)

あとはURLのファイルを入力にして1件ずつsendして正常なURLのみを吐き出すという方法はいかがでしょうか?

id:hkn

ありがとうございます。しかし、すみませんが、私の理解できる範囲を超えています。無知でスミマセン。

2005/08/25 12:58:51
id:tarulen No.3

回答回数10ベストアンサー獲得回数0

ポイント17pt

http://www.forest.impress.co.jp/article/2000/06/01/okiniiri.html

���̓m - �y�����̂��C�ɓ����z�e�L�X�g��HTML�ϊ��uWHTM Limited Edition�vv1.05.14

回りくどいですが、一度テキストをリンク付きにのhtmlにします

次に、リンクチェックソフトで、htmlファイルをチェックします

http://www.vector.co.jp/soft/win95/net/se146069.html

LINK@internet(Windows95/98/Me / インターネット&通信)

これ、windows95だけど使えるかな?

id:hkn

ありがとうございます。HTMLファイルをチェックするソフトならあるんですね。使ってみます。

2005/08/25 13:28:50
id:tarulen No.4

回答回数10ベストアンサー獲得回数0

ポイント17pt

http://www.kumacchi.com/soft/iefck/iefck.html

Internet Explorer お気に入りリンク切れチェッカー

二度すみません、html化したファイルをIEのお気に入りにインポートして、この「Internet Explorer お気に入りリンク切れチェッカー」を使うというのはどうですか?リンク切れの場合削除できるみたいです

id:hkn

こんなのもあるんですね。ありがとうございます。

2005/08/25 13:29:45

コメントはまだありません

この質問への反応(ブックマークコメント)

トラックバック

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません