ニュース 最近のコメント 動画まとめ 先月の記事 毎月の注目記事 問い合わせ ネタ投稿 お気に入り



  • 編集元:プログラム板より「文字コードの種類は何故複数あるのでしょうか?

    1 デフォルトの名無しさん :04/08/23(月) 17:55
    1つにしてくれればPGが苦労することはなくて
    、ミンナうれしいはずなのに。

    3 デフォルトの名無しさん :04/08/23(月) 18:35
    >>1
    アニメの世界であれば、そういう迷惑なことをするのは悪の組織ですよね?
    現実の社会ではどうでしょう?
    クリーンなイメージのあの組織も、もしかすると悪の組織なのかもしれませんね。

    私は、大義名分を振りかざすこと、常に勝つことが重要であると考えています。

    4 デフォルトの名無しさん :04/08/23(月) 18:59
    >>1
    それが資本主義。

  • 8 デフォルトの名無しさん :04/08/23(月) 20:21
    なら、>>1 が新しい統一した文字コードを作れ。

    9 デフォルトの名無しさん :04/08/23(月) 20:33
    >>8
    また増えるからもういいよ

    10 デフォルトの名無しさん :04/08/23(月) 20:55
    2バイト文字を使わなけりゃいいべや。

    11 デフォルトの名無しさん :04/08/23(月) 21:11

    おまえら、まだ文字コード使ってるの?
    俺はだいぶ前から文字しか使ってないよ。

    12 デフォルトの名無しさん :04/08/23(月) 21:36
    あめれか人が悪いに決まってるだ

    14 デフォルトの名無しさん :04/08/23(月) 21:54
    >>12
    欧米人は頭足りないからな

    13 デフォルトの名無しさん :04/08/23(月) 21:48
    もう全部ビットマップでいいよ。

    15 デフォルトの名無しさん :04/08/23(月) 22:24
    UNICODE がもう少しまともだったらなぁ。

    16 ◆Z0vd5w812U :04/08/23(月) 23:09
    >>15
    所詮は「なんでアルファベット以外が存在してんだよ」と思ってる連中が作った規格。

    17 デフォルトの名無しさん :04/08/23(月) 23:23
    1.0と比べると3.2はずいぶんマシになってるし
    あと20年もすれば納得いくものになるんじゃないの

    18 デフォルトの名無しさん :04/08/24(火) 14:16
    Unicode1は所詮ローカライズ用

    19 デフォルトの名無しさん :04/08/29(日) 03:15
    アルファベットの文字コードも複数あるわけですが…

    22 デフォルトの名無しさん :04/10/12(火) 18:35:39
    改行コードの種類は何故複数あるのでしょうか?

    25 デフォルトの名無しさん :04/10/14(木) 00:12:52
    >>22
    昔々、テレタイプという通信機には
    プラテンを1行分進めるラインフィードという制御コードと
    印字ヘッドを左に戻すキャリッジリターンという制御コードが別々にあった
    そんでこいつは初期のコンピュータにつないで端末として使ったりもした。

    それが今の改行コードの元になったわけだが

    MS−DOS,->Windows系列では律儀に上記二つペアを改行コード
    としてそのまま引き継いだ

    UNIX系だとニューライン(ラインフィード)LFだけになり

    Mac系はキャリッジリターンだけを改行コードとして採用した。

    ネットワークプロトコルではCRLFが今でも
    改行コードの標準だが、
    これは

    テレタイプ->ダム端末->telnet,rloginの流れで改行コードも
    引き継がれたからだ。

    26 デフォルトの名無しさん :04/10/16(土) 22:39:45
    >>25
    答えキタ━━━━━━(゚∀゚)━━━━━━ !!!!
    ありがとう
    UNIXがLFなのになんでネットワークがCRLFになっちまったのかと思ってたんだよ

    23 デフォルトの名無しさん :04/10/12(火) 19:52:02
    大人の事情

    27 デフォルトの名無しさん :04/10/16(土) 23:36:27
    http://satosan.jp/ClangStudy.html
    > 遠隔地同士の通信手段としてテレタイプ(通信機能をもった
    > タイプライター) が使われていた頃は、ヘッドが行の端まで
    > 行ったとき次の行の先頭に戻るま で、2文字分通信するのと
    > 同じ時間がかかった。
    > そこで改行の文字コードをCR(復帰:キャリッジリターン '\r')と
    > LF(改行: ラインフィード '\n')の2つに割り当てた。

    31 デフォルトの名無しさん :05/02/10(木) 22:25:42
    >>27
    理由になってないし

    28 デフォルトの名無しさん :04/10/18(月) 20:43:35
    エンディアンの種類は何(ry

    38 デフォルトの名無しさん :05/02/23(水) 19:12:17
    >>28
    普通の答えは、big-endian と little-endianの2種類だが、

    3-4-1-2 や 2-1-4-3 など順序になる不可解なシステムが、過去のミニコン時代にありますた。
    それらは、middle-endian と呼ばれている。

    よって、32ビットでのエンディアンの種類は4種類という事になる。

    30 デフォルトの名無しさん :05/02/10(木) 22:10:51
    TRONコード

    36 デフォルトの名無しさん :05/02/19(土) 00:20:50
    そもそも、自然言語が複数あるんだから、
    文字コードが複数出来るのも自然な流れだと思われ

    37 デフォルトの名無しさん :05/02/23(水) 17:40:30
    >>1
    すべて Unicode Consortium が悪い。
    そうに決まってる。

    41 デフォルトの名無しさん :05/02/23(水) 21:09:47
    XMLの仕様書に書かれてる3-4-1-2や2-1-4-3って実在したのか
    >>37
    ワロス

    51 デフォルトの名無しさん :05/02/25(金) 11:22:52
    >>41
    3-4-1-2ってのは、最小アクセス単位が16 bitでbig-endianなCPU
    (3-4)-(1-2) 別名middle endian
    wordにpackするとこの形になった。(Cの先祖のBCPL、初期のpascal等)

    39 デフォルトの名無しさん :05/02/23(水) 19:26:44
    24種類じゃないの。

    40 デフォルトの名無しさん :05/02/23(水) 19:49:20
    実在が確認されているのが4種類、可能性としては24種類、ということで。

    42 デフォルトの名無しさん :05/02/23(水) 22:23:06
    >>1
    容量制限のため用途に応じた使い分けをせざるを得なかった歴史があるからだよ。
    たしかに文字コードの乱立はうざい。
    こんなに大容量化が進んでマシンのスペックも向上しているにもかかわらず
    文字コードが未だに乱立している原因として考えられることは
    面倒くさがり屋、変化を恐れる愚かな老人達が我々の行動を阻もうとしていることがあげられる。
    日本国内でオブジェクト指向が普及しない原因も、自分の立場を維持したい愚かな老人が
    妨害しているのが原因かもしれない。

    かつて、ある企業が独自規格を作って大儲けを
    たくらんだために文字コードが乱立した可能性もありうる。

    今ではUnicodeがあるというのにほとんどの新しい言語、OSは
    Unicodeが標準だというのに
    頭の古い連中は大したコストパフォーマンスにならないにもかかわらず
    容量制限が・・・
    既存のリソースが・・・・
    などといってUnicodeを採用しようとしない。
    既存のリソースならUnicodeに変換すればいいことだろう。
    まったく愚かだ。Unicodeに鞍替えできない老舗顧客も老舗プログラマも。

    44 デフォルトの名無しさん :05/02/23(水) 22:46:26
    キーボードは乱立しなくてよかったw

    45 デフォルトの名無しさん :05/02/24(木) 10:05:30
    乱立してるだろ

    46 デフォルトの名無しさん :05/02/24(木) 15:47:01
    「俺たちはどうして何でもUnicodeのせいにするのだろう?」
     文字鏡関係者とTRON関係者とGTプロジェクト関係者が何人か集まって考えた。
    しかしいくら考えても結論が出ない。その時、一人がひらめいた。
    「それもUnicodeのせいだ!」
     関係者は全員それで納得した。

    47 デフォルトの名無しさん :05/02/24(木) 18:11:09
    Windowsもとっととunicodeに移行して欲しいよ

    48 デフォルトの名無しさん :05/02/24(木) 19:13:03
    してるじゃん
    出来てないのはiniファイルくらいだろ?

    57 デフォルトの名無しさん :05/02/25(金) 19:46:47
    >>48
    コマンドプロンプトとか無理だろ

    64 デフォルトの名無しさん :2005/05/01(日) 11:20:17
    >>57
    localeモデルにしとけば、Shift_JIS→UTF-8移行も楽だったね。

    65 デフォルトの名無しさん :2005/05/03(火) 05:47:35
    UNICODEだってごちゃごちゃの固まりジャン
    こんな気味悪い文字コードにしなくちゃいけないのはいやだ

    66 デフォルトの名無しさん :2005/05/03(火) 07:29:57
    UTF-8は使用するメモリが1.5倍になるからいやだ

    95 デフォルトの名無しさん :2006/06/16(金) 19:34:55
    >>66
    UTF-8って英数字に対して使うなら容量はそんなに増えなかったかと。

    67 ?デフォルトの名無しさん :2005/05/03(火) 20:19:22
    UTF-8で1.5倍とはしらなかった。

    68 デフォルトの名無しさん :2005/05/04(水) 00:05:00
    漢字のコードポイントのとこなら1文字3バイトだけどね。

    69 デフォルトの名無しさん :2005/05/04(水) 00:05:32
    あ、3オクテットというべきかにゃ?

    70 デフォルトの名無しさん :2005/05/05(木) 17:46:59
    4オクテットの箇所もあるでよ。

    71 デフォルトの名無しさん :2005/11/19(土) 21:54:11
    そこでシフトJISですよ。JIS第3水準、第4水準も難なく扱えるし、な。

    72 デフォルトの名無しさん :2005/11/19(土) 22:22:21
    つうか、そろそろJIS廃止してくれんかの。
    シフトコードウザイ。

    73 デフォルトの名無しさん :2005/11/19(土) 22:27:05
    UCS-4ってのが最後のUnicode?
    Javaだとint型なんだっけ?よーわからんけど、早く統一して欲しい。

    74 デフォルトの名無しさん :2005/11/19(土) 22:43:03
    >>73
    1文字8バイトなんて世界が来るのかね。

    75 デフォルトの名無しさん :2005/11/19(土) 22:44:51
    UTF-8でいいんでしょ?〜とか,箸大丈夫なんでしょ?

    76 デフォルトの名無しさん :2005/11/19(土) 22:53:34
    >>75
    いまのWord、ExcelはUCS-2だから、その世界に収まっている
    仕事ならUTF-8でおけですよ。

    でもオヤクソとかは…

    78 デフォルトの名無しさん :2005/11/20(日) 01:31:35
    >>76
    じゃあUCS-4でいいから今すぐ統一して( ノ><)ノ

    77 デフォルトの名無しさん :2005/11/20(日) 01:29:07
    やっぱり生き残るのはシフトJIS系。
    将来的には半角カナの領域を1バイト目にして可変長のコードにして
    UnicodeやTRONコード、JEF、KEISを丸呑み。

    絶対そうなる。

    79 デフォルトの名無しさん :2005/11/24(木) 02:30:44
    常用漢字とJISが食い違ってるというのもそもそもどんな縦割り行政
    しちょるのかと

    83 デフォルトの名無しさん :2005/11/28(月) 16:44:09
    「龍」の点の向きのこと?
    そんなもん包摂の範囲内だしどっちだっていいやん。
    表外漢字字体表にがちがちにあわせたJIS X 0213:2004のほうが異常。

    92 デフォルトの名無しさん :2006/05/04(木) 13:03:48
    文字コードが増える前に、俺らが使う言葉の数を減らせばいいんじゃね?

    93 デフォルトの名無しさん :2006/05/05(金) 07:04:34
    たしかに。英語だけあれば世の中困ること無いよな。

    100 デフォルトの名無しさん :2006/10/31(火) 17:47:09
    >>1
    64ビットユニコードつかえばいいだろ

    102 デフォルトの名無しさん :2007/01/06(土) 11:43:23
    まず文字コードについてだが、コード云々の前に自然言語の整理が必要だと思う。
    実際にはほとんど使われることがない文字のためにコード領域を使うのは無駄だから
    そういう文字はどんどん淘汰してゆくべき。
    あと、字体がそっくりな文字なんかもできるだけ1つに統合してしまったほうがいい。
    そのあとで国(言語種別)ごとにコード領域を分けて、すべての文字を1つのコード体系に
    収めるべき。

    次に改行コードだが、全部LFで統一でOK。改行ごときに2バイトも必要ない。
    既存のリソースは全部LFに変換してしまえばよい。
    Windowsなんかでファイルの改行を勝手に変換する機能をサポートすれば、
    CR+LFはいずれこの世から自然消滅するだろう。

    最後にエンディアンについてだが、ビッグエンディアンに統一すべき。
    人間が感覚的になじみやすいほうがいいから。

    これらのことをやるにはそれなりの負担がかかるが、その結果得られるメリットを
    考えたらすぐにでも取り掛かるべき。もちろん世界レベルで。

    103 デフォルトの名無しさん :2007/01/10(水) 13:15:10
    バベルの塔で神の怒りに触れ文字コードの種類が沢山になった。
    これは事実で、(ry


    機動警察パトレイバー 劇場版




    ブックマーク: Buzzurl  / Hatena /Yahoo!


    オススメの動画






    同じカテゴリーの記事
    コメントありがとう御座います。最新のコメントへ(37)

    1001  学名ナナシ  :2008年04月07日 17:01  ID:sFq4RISi0
    何の事かわかんね
    1002  学名ナナシ  :2008年04月07日 17:10  ID:kijXUoUi0
    文字コードを統一してもなんかしら問題でそうなきもしないでもない
    1003  学名ナナシ  :2008年04月07日 17:12  ID:sc21yDyl0
    UTF-8まんせーでいいよ、もう。
    1004  学名ナナシ  :2008年04月07日 17:39  ID:l1vTvcla0
    文字使うのはプログラマーだけじゃないからのぉ
    使えない文字があったり不正確な文字があるのはやはり嬉しく無い
    1005  学名ナナシ  :2008年04月07日 17:45  ID:bza0skua0
    文字コードよりブラウザを統一してほしい
    糞ブラウザ作るなボケ
    1006  学名ナナシ  :2008年04月07日 18:05  ID:l1vTvcla0
    >>1005
    ブラウザ統一されたら進化しなくなるぜ
    IEもしばらく停滞してただろ?
    1007  学名ナナシ  :2008年04月07日 18:07  ID:fTSCg1bE0
    そして数年後、
    そこには元気に走り回る世界語の姿が!
    1008  学名ナナシ  :2008年04月07日 18:09  ID:ttn.utZf0
    過去の名残。
    互換性。
    利権。
    新しいものを拒む人もいる。
    規格を決めた当時の想定外が起こるから仕方がない。
    想定外てのは技術の進歩でもある。
    規格を決めて「はい!それ以外認めません!」て事が出来ないから仕方がない。
    1009  学名ナナシ  :2008年04月07日 18:19  ID:TYvUqt2t0
    ウルトラマン「ジュワ!ジュワジュワジュワ!」
    1010  学名ナナシ  :2008年04月07日 18:31  ID:nWHc4F5D0
    >>1004
    テクノロジーは技術者が作るべき
    訳の分からんお役所のくだらない拘りなんかは世の中を悪くする意味しかない
    1011  学名ナナシ  :2008年04月07日 18:38  ID:XANeSG.w0
    この世界の難しいところよな。
    1012  学名ナナシ  :2008年04月07日 18:45  ID:6xVLuDOX0
    データベース等にフォームから投稿するだけでも、
    利用者は文字を入力してボタンを押すだけだが
    裏ではプログラマーが文字化け対策で散々頭を悩ませた挙句
    何で正常に動いてるのか解らない物が出来上がる
    そしてバグの嵐でプログラマー死亡
    1013  学名ナナシ  :2008年04月07日 19:00  ID:l6oz.W6L0
    文字コード以外に統一されたり淘汰されたりしたものはないのだろうか?そのモデルを採用して、一本化する。京都議定書みたい条約つくってさ。
    1014  学名ナナシ  :2008年04月07日 19:06  ID:Be2CbkSQ0
    統一されたら便利だろうとは誰もが思うことだが、実際に統一されたものを目の前に出されたら誰もが不満を言うだろう。

    「統一しろ。でも妥協はするな」とは、気軽に言う人間が思ってるよりも遥かに難しい注文だ。
    1015  学名ナナシ  :2008年04月07日 19:49  ID:YK9NanEk0
    >102はCJKの漢字論争を知らないのだろうか
    1016  学名ナナシ  :2008年04月07日 20:00  ID:RlTgix5m0
    文字コード周りは調べると色々思惑があるみたいで面白いよね。
    まあ沢山あることで苦労する代わりに仕事が貰えるわけだしなあ。
    1017  博士  :2008年04月07日 20:16  ID:4oQ6EvuYO
    こればっかりはな〜
    1018  学名ナナシ  :2008年04月07日 20:25  ID:G2zvhF470
    >>1005
    ブラウザ統一よりもIEの死が先決
    1019  学名ナナシ  :2008年04月07日 21:33  ID:s4ASNPCa0
    使わない文字をがんがん放り込んだバカが隣の半島にいるな。
    1020  学名ナナシ  :2008年04月07日 22:00  ID:6RVL8FXW0
    Unicodeにすれば全て解決!っていうのは甘いんだよねえ
    コードマッピング方法が異なったりしてさらにややこしくなってるしwww
    1021  学名ナナシ  :2008年04月07日 22:01  ID:sGlThyZf0
    改行は統一してもらいたい
    1022  学名ナナシ  :2008年04月07日 22:18  ID:U2wCFbGR0
    UNICODE−SJIS変換で問題になるのはハイフンとか
    ごく一部だけだぞ。元のスレでも妙に叩かれてるけど
    フォントの問題と絡めて何か誤解があるのでは?
    1023  学名ナナシ  :2008年04月07日 22:59  ID:yZItDecI0
    >>1009
    日本語でおk
    1024  学名ナナシ  :2008年04月07日 23:17  ID:DYbrtH6h0
    ロシア語とかギリシャ語は、Unicodeでは全角・半角のどちらでもあり得るという
    困ったチャン。バージョンあがってどっちも両立できるようにならないと、
    半角で表示したら、AA崩れまくるよね。
    1025  学名ナナシ  :2008年04月07日 23:17  ID:IBWD4AYf0
    >>1020,1022
    Windows-31Jってやつだな。
    「〜」が機種依存文字。Vistaだとフォントの関係でどちらを使ってる川からないけど、XP以前ならわかるはず。

    まぁサロゲートペアとか頭いたいけどな。
    1026  学名ナナシ  :2008年04月08日 01:12  ID:n6jA0tOD0
    UTF-8はプログラム内部で使用する文字コードにはなり得ない。
    1文字のサイズが不定だからめんどうでしょうがない。
    バイト数見ても何文字入っているのかわからないし、先頭からシコシコデータを読み込まないとN文字目にアクセスできない

    JavaもC#もWindowsもUTF-16。
    こいつは常に2バイト。(2バイト1文字とは限らないが。)
    高速だし、扱いやすい。

    要するに、乱立する文字コードそれぞれに目的があるということ。
    面倒なのは分かる。
    1027  学名ナナシ  :2008年04月08日 02:29  ID:XfE7ZQfc0
    最近古本屋で買った『電脳社会の日本語』って新書。
    文字コードがいまみたいになってきた話がいろいろと書いてあった。
    読んでて「いいかげんにしてくれ!」て叫びたくなった。
    文字コードのせいで趣味でプログラムしてるときに苦労してんだよなぁ。
    1028  学名ナナシ  :2008年04月08日 04:08  ID:V7ApdYa80
    アマゾンでにやりとしたのは俺だけじゃない筈w
    1029  学名ナナシ  :2008年04月08日 08:53  ID:hkBEHoy60
    じゃUTF-16でおk
    1030  学名ナナシ  :2008年04月08日 13:44  ID:.TUKz4ty0
    おまえらもアジアは全部ハングル使えとか言ったら発狂するだろ
    だから妥協してんの
    1031  学名ナナシ  :2008年04月08日 16:40  ID:kCT.bXYZ0
    バベルだけでパトレイバーとはこれいかに
    1032  学名ナナシ  :2008年04月09日 00:22  ID:VsvXlCav0
    文字は全部画像でおkw
    1033  学名ナナシ  :2008年04月09日 08:22  ID:fZq5yc5Y0
    文字コードはバグの温床だな。
    過去の経験上、ここで引っかかった事例が多分一番多い。
    1034  学名ナナシ  :2008年04月09日 15:47  ID:yLR.JPlM0
    昔JISコードの公式の規格表に誤植があってだな
    1035  学名ナナシ  :2008年04月10日 00:52  ID:uMU9B3pD0
    米1031
    あれじゃね。コンピュータとも掛けてあるんだよ、きっと。
    1036  学名ナナシ  :2008年04月10日 16:10  ID:IB59MygQ0
    クリンゴン語に対応する暇があったらもっと別のことを
    1037  学名ナナシ  :2008年04月13日 11:09  ID:bG2W0Zg80
    利便性とサイズは反比例するので、処理と保存を分ける必要がある。
    といつも思う。
    画像RSS
    おすすめ



    ブログパーツ アクセス解析 アクセス解析 アクセス解析 ブログパーツ レンタルCGI アクセスランキング ブログパーツ ブログパーツ