Antaŭa temo

14. Nomospacoj kaj valorizado

Sekva temo

Diversaj tekstoj

15. Unikodaj ĉenoj

Komencante per Pitono 2.0, nova datumtipo estas havebla al la programisto: la objekto “Unicode”. Oni povas uzi ĝin por teni kaj manipuli datumon unikodan. Unikodo integriĝas bone kun la ekzistaj ĉen-objektoj, provizante aŭto-konverton kiel necese.

Unikodo havas avantaĝon, ke ĝi provizas unu ordonumeralon por ĉiu signo en ĉiu skripto uzita en modernaj kaj antikvaj tekstoj

La kreado de ĉenoj Unikodaj estas tiel simpla kiel kreado de ordinaraj ĉenoj.

>>> u'Saluton, Mondo!'
u'Saluton, Mondo!'

La malgranda u antaŭ la apostrofo indikas, ke la ĉeno estas Unikoda. Se oni volas inkludi specialajn signojn en la ĉeno, oni povas fari tion per uzo de Pitona Unikod-Eskapa kodoprezento. La jena ekzemplo montras metodon.

>>> u'Saluton,\u0020Mondo!'
u'Saluton, Mondo!'

La eskap-sekvenco \u0020 indikas, ke Pitono enmetos la Unikodan signon kiu havas la ordanumerala valoro(deksesuma) 0x0020 (la signo ‘spaceto’) en tiu pozicio.

Pitono interpretas aliajn signojn per uzo de iliaj respektivaj ordonumeralaj valoroj rekte kiel Unikodaj ordonumeraloj. Se oni havas normalan kodoprezenton ‘Latin-1’ (kiu estas uzita en multaj okcidentaj landoj), oni trovos, ke oportune la unuaj 256 signoj de Unikodo estas la samaj kiel la 256 signoj de ‘Latin-1’.

Por spertuloj, estas ankaŭ kruda modalo simila al tio por ordinaraj ĉenoj. Prefiksu la ĉenliteralon per ur por uzi la kruda-Unikoda-Eskapan kodoprezenton. Ĉi tiu modalo nur aplikas la konverton uXXX se estas nepara nombro de maloblikvoj antaŭ la malgranda u.

>>> ur'Saluton,\u0020Mondo!'
u'Saluton, Mondo!'
>>> ur'Hello\\u0020World !'
u'Saluton,\\\\u0020Mondo!'

Aparte de ĉi tiuj normalaj kodoprezentoj, Pitono provizas per aro de aliaj metodoj por krei Unikodajn ĉenojn bazitajn je konata kodoprezento. Kontrolu la Pitonajn dokumentojn Python Library Reference kaj The Python Language Reference por pli da informo.