1. ホーム
  2. c++

[解決済み】非utf8文字というものは存在するのか?

2022-02-10 12:57:43

質問

std::stringの中で非utf8文字をデリミタとして使用できるC++のコードを実装しようとしています。

UTF-8でない文字ってあるんですか?

どのように解決するのですか?

0xC0、0xC1、0xF5、0xF6、0xF7、0xF8、0xF9、0xFA、0xFB、0xFC、0xFD、0xFE、0xFFは、以下の通りです。 無効なUTF-8コード単位 . UTF-8のコード単位は8ビットです。もし char の場合、無効なUTF-8コードユニットは次のようになります。 char の値は、UTF-8 でエンコードされたテキストには現れません。