・UTF-8が浸透するか、それ以外のものが出現するか
・短期的(2年程度後)、長期的(5年以上先)な見通し
・その根拠
これから開発するアプリケーションについて参考にしたいと思っています。
http://www.gentoo.org/doc/ja/utf-8.xml
Gentoo Linux Documentation -- GentooでのUTF-8の使用方法
UTF-8というのが、まず多言語対応しようという動きから生まれたものですが、バイト数が少なくて済むASCII文字には有用ですが、日本語などの所謂マルチバイト文字はデータサイズ面で不利になってしまいます。
将来的にこういう統一したエンコードは不可欠だと思われますが、それによるデータ冗長にムラが大きい。
全体的に、不均衡がないような文字コードが採用されれば、ASCII文字圏以外の多くの国でも進んで採用されるだろうと思います。
短期的には、文字コードの転換はあまり進まないと思います。
しかし、英語圏が率先して導入していく中、マルチバイト圏では浸透は鈍っていくのではないかと考えます。
そこで新たな需要が生まれ、新しい文字コードが開発されていくのではないでしょうか。
長期的には、新しい文字コードがUTF-8に取って代わると思います。世界基準統一のためには、皆がある程度の我慢をすることは仕方のないことなのでしょう。
http://www.customdir.net/ref/ref_comn_02.php
全パッケージ共通事項 - ディレクトリサイト開発支援ツール/CustomDir
UTF-8 に移行する傾向があると 書かれていますので、 将来性はあるでしょう。
確かに最近はプロトコル上でUTF-8を使うことが増えましたね。
短期的な視野ではUTF-8がこれからもシェア(?)を伸ばして普及すると思います。
しかしUTF-8のような2バイトのユニコード(UTF8自体は2バイトではないですが...)は世界で使われている全ての文字や記号に対応できるだけのキャパシティはないです。中国の漢字でさえ6万種類を超えるという話しです。2バイトでは中国語だけでいっぱい一杯です。
今後、中国やタイ、インドなどなど各国のネット環境が充実してくるとUTF-8では間に合わなくなるのは必至です。
そのため長期的な視野で考えると、ユニコードの4バイトバージョンや現在のような文字コードだけでなくビットパターンなども併用するような新しい文字の規格が出現して使われるようになると思います。
今の段階ではアプリケーションの開発はプロトコルはUTF8、内部処理はUTF16で問題はないと思います。
http://www.hatena.ne.jp/1124415862#
人力検索はてな - 現在、インターネットでの文字の扱いはUTF-8が標準だと思われますが、今後の展望はどうなると考えますか?以下の内容を踏まえ、見解を客観的に説明してください。 ・UT..
インターネットのどのプロトコルを指しているのでしょうか?WEB(http)の事を指していると憶測して話をします。また、日本語の文字の扱いに限定します。
『SJIS』『EUC』『UTF-8』の3つが主流です。標準はありません。ましてやUTF-8が標準というのは聞いたことがありません。
httpにはcharsetも同時に指定できます。よって、この文字コードにしなければならない、という制限はありません。
開発環境を考慮すると、Windows環境(MS932)、UNIX環境(EUC,SJIS)が主な開発環境だと思われます。MS932はSJISに良く似たコードで、一般的にはSJISと混同されています。(知らない技術者は多数います。この無知の為に必ずDBとのやり取りの過程で文字化け問題に苦しみます)
httpサーバから配信する文字コードはSJIS,EUC,UTF-8(,稀にJIS)で、アプリケーション内部での扱いは本当に様々です。
今後の展開ですが、現在はWindowsでIEを使うのが最も一般的なWEBブラウズの方法です。これは今後もしばらくは変わらないでしょう。携帯をターゲットにする場合はSJIS。また、他にターゲットにしたいOSやブラウザがあればそれに合わせて開発していくべきでしょう。
1~2年後は次世代WindowsであるWindows Vistaの割合が増えてきます。5年後にはWindows VistaがWindows全体の中で割合が5割程度を占めると思います。
(Vista50%,XP&2K30%,NT10%,ME&98,10%くらいと予想)
よって、インターネット上の文字の扱いは現在とさほど変わりはないかと思われます。
http://www.zukeran.org/shin/jdoc/
japanese font, charactor code / $BF|K\8l%U%)%s%H!"J8;z%3!<%I(B
UTF-8が標準というのは聞いたことがありません。(少なくとも日本語では)
あくまで、標準のうちの一つです。
デファクトスタンダードは、Shift_JIS(厳密には Windows31-J/CP932) でしょう
ただ、Web掲示板とかは EUC-JP、(これはUnixで処理がしやすいから)
メールはあいかわらず ISO-2022-JP が主流です。
今後は、XML/XHTML の普及とともに、UTF-8 もある程度増えて行くことでしょう。
http://e-words.jp/w/UTF-8.html
UTF-8とは 【8-bit UCS Transformation Format】 ─ 意味・解説 : IT用語辞典 e-Words
ちなみに、UTF-8/UTF-16 は、Unicode(UCS-2/4) の表現手法ですから
使いやすい形で処理するのが普通です。
主にネットワークを介した情報のやりとり:UTF-8 (1 ~ 6 byte)
アプリケーションの内部処理:UTF-16 ( 2 or 4 byte)
ちなみに、UTF-8 は、4バイトのUnicode(UCS-4) を表現できます。
UTF-8で間に合わなくなるということはありません。
http://www.itmedia.co.jp/news/articles/0507/29/news049.html
ITmedia�j���[�X�FWindows Vista�͓��{���t�H���g���V�@�ŐVJIS���̗p
今後
・短期的: [blog , SNS 等の普及]
傾向としは、blog , SNS 等の普及により 自分でHTMLを書かない(まぁ今もそうですが)
→ システムの処理しやすい言語(EUC, UTF-8/16)が利用される。
・長期的: [JIS2004対応(JIS X 0213:2004) の Windows Vistaの普及]
一般的に使える文字数が増えるぐらいのインパクト?
[Unix(Linux) でも UTF-8 が普及]
傾向としては短期と同じでしょうけど、Unix でも UTF-8 が普及すると思われますので、
XML ベースのシステムの普及とともに、EUC から UTF-8 への移行が進みそう
コメント(0件)