全角チルダ(~)と波ダッシュ(〜)

「ほえ~」とか「トロピカル~ジュ」とか「ですよね~」で使われる「~」。この~を入力する際、windowsとmacでは見た目は同じでも別の文字コードが入力される。それが波ダッシュ全角チルダだ。


簡単に言うと「波ダッシュ」は長音記号(「へー」とか「ニャー」とかの伸ばす棒)の亜種で、「全角チルダ」はダイアクリティカルマーク(発音区別符号)の一種で発音用の記号だ。
日本語だけ扱うなら波ダッシュで事足りるが、システムは他の言語も扱う以上、どちらも必要になる。


問題は波ダッシュと全角チルダは見た目は同じだが、コンピュータが扱う文字コードが異なることだ。そのため別システムとの連携などで問題になることがある。いや、厳密に言えばフォントによっては判別できるのだが、多くのフォントでは見分けがつかない。
この原因はひとえにUnicodeでの「~」の扱いとwindowsの対応にある。実は先日これに絡んで、社内でトラブル対応を行った。

what(問題は何か)

業務日報システムの報告データを分析したくてCSV出力したが、「3日~5日まで」などの「~」の記号が文字化けして「〜」となっている。

why(何故そうなった)

前提

「~」「〜」は見た目同じでも別物である。波ダッシュと全角チルダは文字コードが違うため、システム上当然別扱い。環境(文字コード)によっては正しく表示されず文字化けしてしまう。

今回の原因

windows入力とmac入力が混在しているのが直接的な原因だった。実はwindowsでは波ダッシュは入力できなくはないが、基本全角チルダ推し(後述)。一方mac(macOS)は波ダッシュでもきちんと受け入れてくれる。

who(誰が影響受ける)

全角チルダまたは波ダッシュを含むデータを吐き出したり、別システムに連携したい人が上記の症状に悩まされることがある。

when,where(いつどこで発生)

windowsでの入力時、またはmacでの入力時に発生。しかし気づくのは連携しようとした時。また、ユーザに全角チルダに統一してよ、と言っても見た目で区別がつかないので現実的に無理だろう。

how(どう対策する)

現実的に考えると「~」は止めて「-」「から」などの表現を使うような運用にするしかないだろう。それでも「~」を使う人はいるので、出てくる都度注意する。
お金に余裕があれば入力欄をカスタマイズして、「~」を統一するのもよいが、windowsの無理筋を自分らがコストかけて対応するというのも筋が違う気がする。
windowsとmacを混在させなければ問題ない話ではあるが、今は良くても今後混在する可能性は十分にあるので、その想定で進むのは危険と考える。

こんな面倒なことになった経緯

この辺りの経緯は下記のサイトが詳しい。
https://dic.nicovideo.jp/a/%E3%80%9C
大まかにまとめると、
発端はUnicodeの検討グループで、「~」波ダッシュの字形を誤ったこと
→マイクロソフト(以下、MS)はMSゴシックなどの基本フォントの波ダッシュにこの間違った字形を設定していた
→MSもこの問題に気づいたものの、既に広くwindowsXPで使われていたため、波ダッシュの字形を独自に変更するのでなく、波ダッシュの代わりに全角チルダ激推しの方針を取ることにした。
→具体的には~を入力しても全角チルダに優先的に変換させるようにした。そのため、半角チルダの全角も波ダッシュの全角も全角チルダに変換されるようになった(そんなのあり?)
→windows VISTAでようやく基本フォントの字形が正しくなったが、この方針は残ってしまい、今日でも全角チルダ推し。因みにgoogle日本語入力の中の人が提案してすぐ通ったんだとか。
(参考サイト:https://internet.watch.impress.co.jp/docs/special/691658.html
→ちなみにグーグル日本語入力は検索候補で右側に薄字で波ダッシュて書いてるのに確定すると全角チルダになる。

小ネタ

今見えている「~」がどちらか知りたければ、windowsのワードパッドを使うとよい。「~」をコピペして、「alt + X」を押すと文字コードが分かる。
FF5Eなら全角チルダ、301Cなら波ダッシュだ。こんな機能初めて知ったけど、windows環境ならFF5Eばかりのはずだ。

ところで・・・

こんな話をしているとCCCPを思い出す。正確には「СССР」か。これ「シーシーシーピー」ではなく、ロシア語の「エスエスエスエル」と読む。
意味はソ連、つまりソビエト社会主義共和国連邦のロシア語で書いた時の頭文字を繋げたものだ。


Google 日本語入力で「えす」「える」を変換するとちゃんと検索候補に出てきてくれる。映画などでこれが出てくると読み方が分かってちょっと優越感を感じるのはロシア語かじった人あるあるだ。あれ、何の話だっけ?ダスビダーニャ。

コメント

タイトルとURLをコピーしました