その時のメモです。抜けていることもありますが大体このような感じで行ったという自分用メモです。参考にできるかもしれませんので載せておきます。
ポイント!
移行後対処が必要になったのは、画像のリンク処理と絵文字です。
基本的にはココログのエクスポートと、はてなブログのインポートを使って移行しました。
ココログのエクスポート
はてなブログのインポート
インポート時に画像の移行も行いました。
画像移行は一部失敗したとなりました。以降失敗した画像は再移行ができるのでしてみました。それで移行できるものもあれば何度しても無理な画像もありました。
失敗画像は一覧でURL表示されますので、一つ一つ画像を手動でupしなおしました。
ここで気が付くのですが、ところどころ記事一覧でタイル画像(アイキャッチ画像)が表示されないところがありました。
また、ブログ内の画像をクリックすると一部はココログの画像へリンクして拡大表示するものもありました。
ココログのエクスポートとはてなのインポートでできることはこれくらいです。
はてなブログに取り込まれた
ココログに係る情報をHTMLを編集して整理(主に画像関係)
次に、ココログでしか使えないリンク記述をHTML編集で直接調整するために、はてなブログに収まったブログデータを、はてなブログのエクスポート機能を使用して一旦PCに保存しました。
これで現時点のバックアップファイルができた状態です。これから編集するので名前を変えて複製したファイルを編集することにしました。
バックアップとして保存したはてなのMT形式のHTMLデータを直接編集して再びインポートする方法です。
- UTFの文字コードが扱えるgrep置換ソフトで、cocologという文字をキーに検索をしました。
- 結果、数種のリンクパターンがあり、それぞれに対応しました。基本的にそのリンクの意味を持つHTML部分を消しました。(ココログでしか使えないリンクだったので
- 画像をクリックするとonloardや別画面でココログの画像を表示するリンク部分のHTML記述を削除しました。
- IMAGE: http://ココログID.cocolog-nifty~jpg といった部分の削除
(アイキャッチ画像の指定?)
確認したわけでないですが、これらを消すとココログを参照せず、はてな内の代替的な表示になるようです。
ココログ独自の絵文字アイコンは無くてもよかったので関する記述を消しました。(Six Apart 絵文字 ですので、一部はその画像を取り込みgif画像で表示させました)
- [E:絵文字外字番号]記述を削除
これでココログに絡む不要な表示がなくなりました。ココログのデータを消しても影響ない状態となりました。
再びはてなブログにインポート
(はてなブログのバックアップを復活させる際のヒントでもある)
はてなブログのインポートについて実験してみました。
はてなブログにある記事タイトルとMT形式のバックアップから同じ記事タイトルをインポートすると、同じ記事で上書きされるのでなく、インポートされるたびに2重、3重と記事が増えていく仕様でした。
ここで増えた記事のURLがどうなるか?
同じ記事を残して、インポートしたURLの後にハイフンと枝番が付いて別のアドレスができました。ならば同じ記事をあらかじめ削除していたらどうなるか?
結果、消した元のURLでインポートできました。
ということで、あらかじめインポートする記事をはてなブログの記事一覧から削除することで、バックアップデータから取り込み同じURLで復旧させることができるとわかりました。これは既に検索サイトのクローラーなどでURLが登録されている場合に比較的重要なことです。
さぁ、ここまでわかったら実行あるのみ、ファイナルです。
- ココログからのインポートで出来たはてなブログの記事ほぼすべて削除しました。
(はてなブログは記事一覧から削除できるが、20件ずつしか対象を増やせないので1000件ぐらい記事があると面倒でした) - 先に編集したバックアップデータをインポートしました。
これらのことをして
はてなブログへの移行後、ココログから変更された点(私の場合)
まぁ、あまり影響なく完了したので良かったですが、暇ができた時にトライアンドエラーで試したので、完了するまで1か月かかりました。
- 画像をクリックしたときの拡大画像表示はあきらめました
- ココログでは画像ファイル名に意味を持たせていたのですが、はてなブログの仕様上、ファイル名が変更されるため反映できませんでした。(画像にマウスオーバーで元ファイル名が表示されるようになっていました)
- コメント/トラックバックの移行は面倒のもとになってはいけないと切り捨てました。
結果うまくいきましたが、進めていくにあたり、前の環境に戻れるよう考えながら、慎重に実施・確認、やり直しで戻るかを判断しつつ行わなければ、最悪の場合クリックしてもリンク先がないとか、一部文字化けや画像がないとか見苦しいブログになってしまう恐れのある作業でした。