あとで見ておこうと思っていたウェブサイトが消失している・・・そんな事になる前にさっとデータを保存しておきたいものです。
ウェブ魚拓というサービスはHTMLデータをウェブ魚拓サーバにキャッシュしておくことで、元のサイトの文章が消失したり、改竄されても保管できるというものです。
ウェブ魚拓
http://megalodon.jp/
私はPHPのfile関数を使ったのでどのサイトも問題なく取得できました。
サイト毎に文字コードは違うので、それらを確認しつつ出力時の内部コードを変えないといけません。こちらはまだ作成中
HTMLに記述されているIMGタグ内の画像も出力するかどうか・・ということです。現在製作中のものはとりあえずHTMLコードのみ。本家では「引用」と「丸ごと」でうまくわけているみたいですね。
まだ記事にするまでもない内容だったのですが、とりあえず紹介しておきました。