今の所用意してあるデータは常用漢字と、一部のJIS擴張"新"漢字だが、JIS擴張は些か對應が甘いやうである。
「濾過」を「沪過」とするやうな恐ろしい記述への對應は、JIS擴張に含まれる仔細なデータが用意できなかつたので今のところ不十分である。
といふのも、常用漢字でもないのに正字ではなく常用漢字風にされ、新JISになり始めて含まれた例、これにのみ對應するからである(啞、焰、鷗、俠、醬、蟬、瘦、瀆、など)。
これらの例は、携帶では常用漢字風の字しか使へぬといふ、をかしい事態が發生するわけだが、それはまた別の話。
一方の常用漢字では、「豊」「豐」のやうに別字でも明らかに「ユタカ」の意味でしか遣はない文字は逐次變換するが、 「弁」のやうにどれとどれを對應させるべきか惱む字や、置換へ字「炎色と焰色」交ぜ書き「干ばつと旱魃」などの場合始末に負へないので、 文書作成者にどこまで敎養があつて、置換へ字交ぜ書きを全く使用しないだけの素養があることを望む許りである。
stringsファイル はコレクションクラスをUTF-16でシリアライズした物であり、ここでは辭書である(通常は文字と鍵だけだが、實態はplistなのでplistの範圍なら何でも可)。
辭書の名の通り、鍵で辭書から必要なデータを指定・特定して取り出すことができる。
ここでは文字コードが確りと存在する置換できる漢字だけである。また辭書に存在しない鍵の場合は別に指定した文字を返してくれるので、全てをstringsファイルに書く必要はない。
上述の「弁」のやうに、對應させるべき文字が無い物なぞを列擧する必要があるだらう。
「覇」は「霸」を正字と看做さなかつたが、これは私がよくわからなかつたから排除しただけである。
「姊」を正字、「貓」「馱」は趣味。「着」は「著」の略字なので、「着」は全て「著」とした。「回」は「囘」とした。
「即」は「卽」だが、「既」は「旣」と「既」のうち「既」。惱み所。「節」「饗」「響」「鄕」などと合はせるのがよからうか。フォントによりバラバラな點も實に腹立たしい。
亞、惡、壓、圍、爲、醫、壹、逸、稻、飮、隱、羽、營、榮、衞、銳、益、驛、悅、謁、閱、圓、緣、鹽、奧、 應、橫、歐、毆、黃、溫、穩、假、價、禍、畫、會、囘、壞、悔、懷、海、繪、慨、槪、擴、殼、覺、學、樂、 割、喝、渴、褐、勸、卷、寬、歡、漢、罐、觀、閒、關、陷、館、顏、器、旣、歸、氣、祈、僞、戲、犧、舊、 據、擧、虛、峽、强、挾、敎、狹、鄕、響、曉、勤、謹、區、驅、勳、薰、形、徑、惠、揭、溪、經、繼、莖、 螢、輕、鷄、藝、擊、缺、儉、劵、劍、檢、權、獻、硏、縣、險、顯、驗、嚴、戶、吳、娛、效、廣、恆、鑛、 號、吿、國、穀、黑、再、歲、濟、碎、齋、劑、櫻、册、殺、雜、參、慘、棧、產、蠶、贊、殘、姊、祉、絲、 視、飼、齒、兒、辭、濕、實、舍、寫、煮、社、者、勺、釋、壽、收、周、臭、從、澁、獸、縱、祝、肅、處、 暑、緖、署、諸、敍、奬、將、尙、涉、燒、祥、稱、證、乘、剩、城、壤、孃、條、淨、狀、疊、讓、釀、囑、 觸、寢、愼、眞、神、盡、圖、粹、醉、隨、髓、數、樞、瀨、成、精、晴、淸、聲、靑、靜、齊、稅、攝、竊、 節、說、絕、專、戰、淺、潛、纖、踐、錢、禪、祖、僧、雙、壯、層、搜、插、巢、爭、總、莊、裝、騷、增、 憎、臟、藏、贈、卽、屬、續、墮、馱、體、對、帶、滯、臺、瀧、擇、澤、脫、單、嘆、擔、膽、團、彈、斷、 癡、遲、著、晝、蟲、鑄、著、廳、彫、徵、懲、潮、聽、敕、鎭、塚、遞、鐵、轉、點、傳、都、黨、冬、盜、 燈、當、鬭、德、獨、讀、突、屆、內、繩、難、貳、寧、貓、惱、腦、廢、拜、梅、賣、麥、發、髮、拔、繁、 飯、晚、蠻、卑、碑、祕、姬、濱、賓、頻、敏、甁、侮、福、拂、佛、倂、塀、竝、變、邊、勉、舖、步、穗、 寶、襃、豐、墨、沒、每、萬、滿、免、默、戾、藥、譯、諭、輸、豫、餘、與、譽、搖、樣、謠、來、賴、亂、 欄、覽、隆、龍、虜、兩、獵、綠、壘、淚、類、勵、禮、隸、靈、齡、曆、歷、戀、練、連、鍊、爐、勞、廊、 朗、樓、郞、錄、灣
一往こんな感じなのだが、他にもあるなら敎へてくれればありがたい。四〇五/一九四五文字
差分の內、文字コードのある物。最後の「燈」は當用漢字の表外字だつたが、常用漢字の附表では「灯」で追加された。
常用漢字に擴充され繼承された當用漢字についてこれ以上觸れない。
殼、喝、褐、罐、挾、溪、螢、棧、尙、繩、壤、脣、齊、插、馱、塚、貓、頻、甁、塀、襃、龍、戾、燈
JIS で常用漢字を擴張した全ての例。乙以降は重複するが、經緯を副へて記す。
「兔」「兔」は「兔」にした。「函」は「極」などに合はせて「凾」にした。
「弐」「弍」は別だが、「弍」も「貳」とした。
「亘(めぐる)」「亙(わたす)」は別だが、「亙」の意で使用するので、「亘」は「亙」とした。
鰺、鶯、蠣、攪、竈、灌、諫、頸、礦、蘂、靱、賤、壺、礪、檮、濤、邇、蠅、檜、儘、藪、籠、堯、槇、遙、 瑤、穎、曾、枡、濾、蘆、彎、啞、焰、鷗、嚙、俠、軀、繫、鹼、麴、屢、繡、蔣、醬、蟬、搔、瘦、驒、簞、 摑、塡、顚、禱、瀆、囊、潑、醱、頰、麪、萊、蠟、攢、俱、剝、𠮟、吞、噓、姸、屛、幷、禰、彌、倅、僭、 廳、悴、擡、曠、檔、槶、櫳、櫟、淵、瓔、疇、箏、纃、翠、艫、襌、譖、轟、輛、鐸、鑪、鑽、隯、麩、鼠、 兔、爾、凾、貳、亙、滲、蔘、厲、𣜜、鑵、欟、脛、纊、箋、餞、碊、膾、燼、壗、豅、隴、嶢、橈、饒、儞、 儞、爾、爾、嬭、璽、熖、滔、舂、睨、舊、蹈、嘔、謳、甌、齟、齧、齬、夾、莢、鋏、劒、嶮、撿、瞼、麬、 婁、瘻、籔、螻、嘯、蕭、鏘、憚、鷆、儔、籌、躊、擣、犢、襄、癈、瓚、纘、鑽、讚、竈、竈、楡、鰊、鶫、 仞、簗、渚、豬、柹、𢌞、脣、浩、靖、彥、祐、祿、禎、櫨、轤、驢、鱸、龜、艷、餠、栅、櫔
「爾」「儞」は、にはかに信じ難いことだが、「尓・尒・尔」「伱・你」と幾つもあつたので、重複する。
「竈」も「竃・𥧄・䆴」と三つある。「豬」は「猪」の正字。「脣」は、「唇(=震へる)」と別字だが、「脣」許りなので。「柹」を正字。
「廻」の「𢌞」は「廽」「迴」などは無視した。「櫛」「櫛」や「溺」「溺」、「漣」「漣」は2004で同じに見えるやうになつたので、無視した。
JIS X 0208に存在したが昭和五八年の「擴張新字體」で消失、JIS補助漢字・擴張漢字(JIS X 0212・JIS X 0213)で復活した31字。
少ないのでさつさと列擧。乙種は呼び分ける爲の物で、特に意味はない。
「麵」と「麪」では、正字の「麪」に變換するやうにしてある點以外は、特に問題はないだらう。
啞、焰、鷗、嚙、俠、軀、繫、鹼、麴、屢、繡、蔣、醬、蟬、搔、瘦、驒、簞、摑、塡、顚、禱、瀆、囊、潑、 醱、頰、麪、萊、蠟、攢
常用漢字表の表外漢字を改めてしまつた21字に對應する漢字で、「表外漢字字體表」に簡略字があるもの。JIS X 0213:2004 含む。
啞、穎、鷗、攪、麴、鹼、嚙、繡、蔣、醬、曾、搔、瘦、禱、屛、幷、枡、麵、濾、蘆、蠟、彎
Unicode上に存在した爲 JIS X 0213:2004 で追加された字形。10字。乙種と一部被る。
俱、剝、𠮟、吞、噓、姸、屛、幷、瘦、繫
JIS78とJIS83に於ける、第1水準と第2水準の置換。
鰺、鶯、蠣、攪、竈、灌、諫、頸、礦、蘂、靱、賤、壺、礪、檮、濤、邇、蠅、檜、儘、藪、籠
JIS78の第1水準から、JIS83で作字・簡略化し、第2水準へと置換。
堯、槇、遙、瑤
字形が完全に變更された字。正字風に差換へられる。JIS X 0213:2000 から JIS X 0213:2004 で例示字形が變化したため。
フォントにより字形が異なる。
逢、芦、飴、溢、茨、鰯、淫、迂、厩、噂、餌、襖、迦、牙、廻、恢、晦、蟹、葛、鞄、釜、翰、翫、徽、祇、 汲、灸、笈、卿、饗、僅、喰、櫛、屑、粂、祁、隙、倦、捲、牽、鍵、諺、巷、梗、膏、鵠、甑、叉、榊、薩、 鯖、錆、鮫、餐、杓、灼、酋、楯、薯、藷、哨、鞘、杖、蝕、訊、逗、摺、撰、煎、煽、穿、箭、詮、噌、遡、 揃、遜、腿、蛸、辿、樽、歎、註、瀦、捗、槌、鎚、辻、挺、鄭、擢、溺、兎、堵、屠、賭、瀞、遁、謎、灘、 楢、禰、牌、這、秤、駁、箸、叛、挽、誹、樋、稗、逼、謬、豹、廟、瀕、斧、蔽、瞥、蔑、篇、娩、鞭、庖、 蓬、鱒、迄、儲、餅、籾、爺、鑓、愈、猷、漣、煉、簾、榔、屢、冤、叟、咬、嘲、囀、徘、扁、棘、橙、狡、 甕、甦、疼、祟、竈、筵、篝、腱、艘、芒、虔、蜃、蠅、訝、靄、靱、騙、鴉
JIS83で字形が變更された字。一部は庚種である。
フォントにより字形が異なる。
唖、逢、芦、飴、溢、鰯、淫、迂、欝、厩、噂、餌、焔、襖、鴎、迦、恢、拐、晦、概、喝、葛、鞄、噛、澗、 翰、翫、徽、祇、侠、卿、僅、躯、喰、櫛、屑、靴、祁、慧、稽、繋、荊、隙、倦、嫌、捲、鹸、諺、巷、昂、 溝、麹、鵠、甑、采、冴、榊、柵、薩、鯖、捌、錆、珊、屡、遮、杓、灼、繍、酋、曙、渚、薯、藷、哨、廠、 梢、蒋、醤、鞘、蝕、靭、逗、翠、摺、逝、蝉、撰、栓、煎、煽、詮、噌、遡、創、掻、痩、遜、騨、腿、黛、 啄、濯、琢、蛸、巽、辿、棚、鱈、樽、箪、註、瀦、凋、捗、槌、鎚、塚、掴、辻、鄭、擢、溺、填、顛、堵、 屠、菟、賭、塘、祷、鴇、涜、瀞、噸、遁、頓、那、謎、灘、楢、禰、嚢、牌、這、秤、剥、箸、溌、醗、挽、 扉、樋、柊、稗、逼、媛、謬、廟、瀕、頻、蔽、瞥、娩、庖、泡、蓬、頬、鱒、迄、麺、儲、餅、籾、鑓、愈、 癒、猷、熔、耀、莱、遼、漣、煉、蓮、榔、蝋、兔、冉、冕、冤、唹、唳、嘲、嚥、堋、媾、寃、屏、悗、捩、 搆、攅、斃、枦、枴、梛、梍、湮、爨、珎、甄、甍、甕、皓、硼、稱、龝、箙、粐、粮、綛、綮、綟、翔、舮、 芍、苒、茣、荵、蔗、蛛、螂、蟒、褊、覯、諞、譁、跚、踉、輓、迪、遘、邉、扈、釁、霤、靠、靱、頤、鬮、 鮗、鯲、麪、龜
藤、誰、俺、岡、頃、奈、阪、韓、弥、那、鹿、斬、虎、狙、脇、熊、尻、旦、闇、籠、呂、亀、頬、膝、鶴、 匂、沙、須、椅、股、眉、挨、拶、鎌、凄、謎、稽、曽、喉、拭、貌、塞、蹴、鍵、膳、袖、潰、駒、剥、鍋、 湧、葛、梨、貼、拉、枕、顎、苛、蓋、裾、腫、爪、嵐、鬱、妖、藍、捉、宛、崖、叱、瓦、拳、乞、呪、汰、 勃、昧、唾、艶、痕、諦、餅、瞳、唄、隙、淫、錦、箸、戚、妬、蔑、嗅、蜜、戴、痩、怨、醒、詣、窟、巾、 蜂、骸、弄、嫉、罵、璧、阜、埼、伎、曖、餌、爽、詮、芯、綻、肘、麓、憧、頓、牙、咽、嘲、臆、挫、溺、 侶、丼、瘍、僅、諜、柵、腎、梗、瑠、羨、酎、畿、畏、瞭、踪、栃、蔽、茨、慄、傲、虹、捻、臼、喩、萎、 腺、桁、玩、冶、羞、惧、舷、貪、采、堆、煎、斑、冥、遜、旺、麺、璃、串、填、箋、脊、緻、辣、摯、汎、 憚、哨、氾、諧、媛、彙、恣、聘、沃、憬、捗、訃、遡、椎、賭、刹
どの字體になるかは興味はないが、二一年二月迄の情報。その某所でみた案を列擧。下記はその內、文字コード上に正字がある物。
彌、龜、頰、曾、剝、𠮟、艷、餠、瘦、栅、櫔、麪、塡、箋、憚
「紡錘(絲)」「銑鐵」「膨脹」は晴れて平假名混ぜ書きとなります。おめだたう。以下は削除豫定の漢字
銑、錘、勺、匁、脹