トップ «前の日記(■2004-04-12) 最新 次の日記(■2004-04-17)» 編集

どんぞこ日誌

2003|08|09|10|11|12|
2004|01|02|03|04|05|06|07|08|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|07|08|12|
2007|01|04|08|12|
2008|01|02|03|04|06|07|08|10|11|12|
2009|01|02|04|05|06|07|08|09|11|12|
2010|01|03|04|07|08|10|11|12|
2011|01|02|03|04|05|06|07|08|10|12|
2012|01|02|03|05|06|07|08|09|10|
2013|01|02|07|08|09|
2014|08|09|
2015|08|
2016|06|07|12|
2017|01|03|08|
2018|03|
2022|03|
2023|03|
2024|02|

同人関連(どんぞこ楽屋) | 旧い雑文   


■2004-04-15

* [Perl] Encode::Guessの補助B!

  JEncode.pm v.1.22。結局shiftjisとeuc-jpを正しく判定するための「補助判定」は以下のようになってしまいました。

$str =~ m/((?:
  \p{InHiragana}                   | #
  \p{InKatakana}                   | #
  \p{InCJKUnifiedIdeographs}       | #
  \p{InHalfwidthAndFullwidthForms} | #
  \p{InCJKSymbolsAndPunctuation}   | #
  \p{InArrows}                     | #
  \p{InGeneralPunctuation}         | #
  \p{InGeometricShapes}            | # ■▲など
  \p{InMiscellaneousSymbols}       | # ♂♀など
  \p{InMathematicalOperators}      | # ⊃∨など
  \p{Greek}                        | # 
  \p{InCyrillic}                   | # 
  \p{InBoxDrawing}                   # 罫線
)+)/gx;

  これで大抵の文字とマッチするでしょう(まる数字などの機種依存文字は含まれていません)。ところでギリシャ語のブロックを利用するため\p{InGreek}と書くと、「そんなものはない」とperlに怒られてしまいます。何故?

追記(2004-04-16)
  原因がわからないので、ソースで確認。lib/unicore/Blocks.txt(perl5.8.3) をみると、ギリシア語ブロックの名前が'Greek and Coptic'となっていました。\p{InGreekandCoptic}とすれば解決。他のドキュメントではGreekとかInGreekで例が出ていたのに。

追記(2004-04-19)
  って、perlunicodeに書いてあるじゃん! あ〜あ。

* [雑感] メモメモメモB!

 自作自演を検証するページ。まあ、そのまんまです。

 Documents by Moondance Laboratory。どこかでみたことあるノリだと思ったら、「波動機関もえもえ」の人なのね。以前よりふっきれた感じで面白いかなあ。

 人の生命をおもちゃにして遊ぶ人の顔をしたケダモノ。コメント欄をみますに、これは一種の「ゴキブリホイホイ」ということだったのかしら。

[]