倭マン's BLOG

くだらない日々の日記書いてます。 たまにプログラミング関連の記事書いてます。 書いてます。

CharSet

Sun の JDK (バージョン 1.6.0_01)で利用可能な CharSet (java.nio.charset.Charset) を列挙。 160個ありました。

次のようなコードで利用可能な CharSet を列挙できます:

import java.util.Map;
import java.nio.charset.Charset
...

Map<String, Charset> map = Charset.availableCharsets();
for(String key: map.keySet()){
    System.out.println(key);
}

IBMXXX


43個

  • IBM-Thai
  • IBM00858
  • IBM01140
  • IBM01141
  • IBM01142
  • IBM01143
  • IBM01144
  • IBM01145
  • IBM01146
  • IBM01147
  • IBM01148
  • IBM01149
  • IBM037
  • IBM1026
  • IBM1047
  • IBM273
  • IBM277
  • IBM278
  • IBM280
  • IBM284
  • IBM285
  • IBM297
  • IBM420
  • IBM424
  • IBM437
  • IBM500
  • IBM775
  • IBM850
  • IBM852
  • IBM855
  • IBM857
  • IBM860
  • IBM861
  • IBM862
  • IBM863
  • IBM864
  • IBM865
  • IBM866
  • IBM868
  • IBM869
  • IBM870
  • IBM871
  • IBM918

ISO-XXX


15個

  • ISO-2022-CN
  • ISO-2022-JP
  • ISO-2022-JP-2
  • ISO-2022-KR
  • ISO-8859-1
  • ISO-8859-13
  • ISO-8859-15
  • ISO-8859-2
  • ISO-8859-3
  • ISO-8859-4
  • ISO-8859-5
  • ISO-8859-6
  • ISO-8859-7
  • ISO-8859-8
  • ISO-8859-9

UTF-XXX


7個

  • UTF-16
  • UTF-16BE
  • UTF-16LE
  • UTF-32
  • UTF-32BE
  • UTF-32LE
  • UTF-8

windows-XXX


10個

  • windows-1250
  • windows-1251
  • windows-1252
  • windows-1253
  • windows-1254
  • windows-1255
  • windows-1256
  • windows-1257
  • windows-1258
  • windows-31j

x-IBMXXX


34個

  • x-IBM1006
  • x-IBM1025
  • x-IBM1046
  • x-IBM1097
  • x-IBM1098
  • x-IBM1112
  • x-IBM1122
  • x-IBM1123
  • x-IBM1124
  • x-IBM1381
  • x-IBM1383
  • x-IBM33722
  • x-IBM737
  • x-IBM834
  • x-IBM856
  • x-IBM874
  • x-IBM875
  • x-IBM921
  • x-IBM922
  • x-IBM930
  • x-IBM933
  • x-IBM935
  • x-IBM937
  • x-IBM939
  • x-IBM942
  • x-IBM942C
  • x-IBM943
  • x-IBM943C
  • x-IBM948
  • x-IBM949
  • x-IBM949C
  • x-IBM950
  • x-IBM964
  • x-IBM970

x-MacXXX


14個

  • x-MacArabic
  • x-MacCentralEurope
  • x-MacCroatian
  • x-MacCyrillic
  • x-MacDingbat
  • x-MacGreek
  • x-MacHebrew
  • x-MacIceland
  • x-MacRoman
  • x-MacRomania
  • x-MacSymbol
  • x-MacThai
  • x-MacTurkish
  • x-MacUkraine

x-windows-XXX


6個

  • x-windows-50220
  • x-windows-50221
  • x-windows-874
  • x-windows-949
  • x-windows-950
  • x-windows-iso2022jp

その他

  • Big5
  • Big5-HKSCS
  • EUC-JP
  • EUC-KR
  • GB18030
  • GB2312
  • GBK
  • JIS_X0201
  • JIS_X0212-1990
  • KOI8-R
  • KOI8-U
  • Shift_JIS
  • TIS-620
  • US-ASCII
  • x-Big5-Solaris
  • x-euc-jp-linux
  • x-EUC-TW
  • x-eucJP-Open
  • x-ISCII91
  • x-ISO-2022-CN-CNS
  • x-ISO-2022-CN-GB
  • x-iso-8859-11
  • x-JIS0208
  • x-JISAutoDetect
  • x-Johab
  • x-MS950-HKSCS
  • x-mswin-936
  • x-PCK
  • x-UTF-16LE-BOM
  • X-UTF-32BE-BOM
  • X-UTF-32LE-BOM

ちなみに、拙者の現在の環境では、デフォルトのエンコーディング (Charset.defaultCharset() の返り値)は "UTF-8" でした。