またぞろHATENA-TUBEがとまってます

一応見れますが、現在更新不能状態です。

坂本さんのお力で復帰したハテチューですが、再び不正なUTF8の魔の手がせまってきました。

Input is not proper UTF-8, indicate encoding ! Bytes: 0×9A 0xE3 0×83 0xAB in

犯人はこのブックマーク。はてなの出力がショボイのか、PHPという言語がショボイのかはわかりませんが、すくなくとも僕がショボイのは確実です。

UTF8にマッチする正規表現
UTF-8 の文字にマッチする正規表現
UTF-8 vs. ISO-10646

グーグル超先生のお力で色々と資料みつけたり、正規表現辞典 を買ってみたりしたのですが、じゃあ実際にperlのコードをどうphpに適用するかというと、まったくもって謎です。

コメントをどうぞ