[過去ログ] C++相談室 part154 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
556: 2021/02/06(土)15:21 ID:58EQLFGq(3/5) AAS
行政が法律に基づき行うなら問題無い
人が作った法律なら人が改正することができる
557
(1): 2021/02/06(土)15:22 ID:S9Y30hRK(6/7) AAS
スレ違い板違い失せろ
558: 2021/02/06(土)15:28 ID:58EQLFGq(4/5) AAS
>>557
>>555に対するレス
559: 2021/02/06(土)15:30 ID:f5ipo2xA(2/2) AAS
自作自演?
560
(1): 2021/02/06(土)16:36 ID:oR/8CbQ7(1/2) AAS
やらかしちゃいましたねー
人を見下しておきながら、人を見下す側もウッカリミスはするという事が証明されました

こういうウッカリ屋はプログラミングでも不具合を引き起こします
馬鹿でも天才でもウッカリ屋でも保守できるコードは記述するように心がけましょう
561
(3): 2021/02/06(土)16:38 ID:oR/8CbQ7(2/2) AAS
>>560
他にもテストの自動化、バージョン管理ツールの導入等もして不具合が流出しない仕組みを揃えておきましょう
以上
562
(2): 2021/02/06(土)16:54 ID:bwIKlxQ8(1) AAS
std::stringにUTF-8のコードを入れてプログラムを書いていますが、これを正しく編集する
にはUTF-8での文字の境界を正しく認識しないと駄目ですよね?
それは一般的にはどう処理するものなのでしょうか。

UTF-8のビットパターンとバイト数のことは知っていますが、それを自分で処理すべきか、
さらには絵文字とか複数のユニコードが組み合わさったものはどうするのか、とか。
563: はちみつ餃子 ◆8X2XSCHEME 2021/02/06(土)17:05 ID:N9CbrPsc(1) AAS
>>562
コードポイント単位での処理で良いのであれば自分で適当に書いてしまってもいいと思う。

高度なものになると ICU などのライブラリを使う。
書記素クラスタ単位での処理が必要だったり正規化だったりといった場合では
コードを書けば済むというものでもなくて巨大な表が必要だし歴史的な変な規則が盛りだくさんだから
よほどの根性がないと自分ではどうにもならないと思う。
564: 蟻人間 ◆T6xkBnTXz7B0 2021/02/06(土)17:07 ID:gG6zzvvp(1/4) AAS
>>562 Windowsだったら
#include <windows.h>
MultiByteToWideChar(CP_UTF8, 0, ...);
MultiByteToWideChar(CP_UTF8, MB_ERR_INVALID_CHARS, ...);
WideCharToMultiByte(CP_UTF8, 0, ...);
IsTextUnicode(...);
などが使えると思われます。
565: 2021/02/06(土)17:41 ID:GfZyzG1j(2/4) AAS
スカラー値が一文字を表現するとは限りませんが、ユニコードスカラー値を基本にするのが現実的な妥協点だと思います。
きちんと処理するのは、データベースとアルゴリズムが必要なので、少人数では無理です。
ICUが有力な選択肢となりますが、これも気難しいライブラリなので、用途に合わないかもしれません。

事実上、世界中の様々な民族の文字を統一的に扱う目論見は破綻していると思います。
566
(1): 2021/02/06(土)17:44 ID:+KPQZs33(1) AAS
動画リンク[YouTube]
567: 蟻人間 ◆T6xkBnTXz7B0 2021/02/06(土)17:50 ID:gG6zzvvp(2/4) AAS
外部リンク:ja.wikipedia.org

>任意のバイトの先頭ビットが "0" なら1バイト文字、"10" なら2バイト以上の文字の2番目以降のバイト、...(中略)...であると判定できる。
568: 蟻人間 ◆T6xkBnTXz7B0 2021/02/06(土)17:55 ID:gG6zzvvp(3/4) AAS
つまり、

uint8_t utf8_byte = ...;
if (!(utf8_byte & 0x80)) {
// 1バイト文字。
} else if ((utf8_byte & 0xC0) == 0xC0) {
// マルチバイト文字の先頭バイト。
} else {
// マルチバイト文字の非先頭バイト。
}
569: 2021/02/06(土)18:11 ID:6eQmSTNr(1) AAS
プログラミングのお題スレ Part18
2chスレ:tech

UTF-8 は、先頭ニブル・4ビットで、1〜4バイト文字を判別しています

こういう規則か?
570
(3): 2021/02/06(土)19:16 ID:S9Y30hRK(7/7) AAS
>>561
殺虫剤のパラドックスって知ってる?
571
(1): 2021/02/06(土)20:33 ID:zn5WrP4C(1) AAS
>>570
恥の上塗り?w

ただし、自動化されたリグレッションテストの場合は、同じテストを繰り返すことでリグレッションが低減しているという有益な結果を示すことができる。
外部リンク:note.com
572: 2021/02/06(土)21:07 ID:GfZyzG1j(3/4) AAS
テストロボットだぞ、ガシャーン!ガシャーン!
573
(1): 2021/02/06(土)21:08 ID:GfZyzG1j(4/4) AAS
片山さんの自動パズルとか、ウェブだったら☆1万くらいついてそうだけど。
なんでWindowsにこだわるんだろ。
574: 蟻人間 ◆T6xkBnTXz7B0 2021/02/06(土)22:54 ID:gG6zzvvp(4/4) AAS
>>573 JavaScriptで動くものはすでにある。
外部リンク:katahiromz.github.io
あるが、ビジネスとして展開する能力がない。
575: 2021/02/06(土)23:50 ID:58EQLFGq(5/5) AAS
クレブナー基底で解くやつ!
1-
あと 427 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.022s