Representaciˇ informÓtica dels carÓcters

═ndex

 

Introducciˇ

Amb els teclats emprats en els pa´sos on es fan servir els carÓcters llatins, grecs o cirÝlĚlics no Ús possible representar directament els codis especials del pinyin ni els carÓcters xinesos; per a fer-ho cal seguir, d'una manera o altra, algun procediment indirecte.

 

C˛pia de carÓcters des d'un altre document

Si volem copiar carÓcters presents en un document HTML o de Word, n'hi ha prou de copiar en el document de procedŔncia i enganxar en el de destÝ (no cal que tots dos siguin del mateix tipus).

 

Inserir un carÓcter especial com sÝmbol

Si no podem copiar el carÓcter, hem d'inserir-lo com un sÝmbol. En el cas del Word cal:

  1. Seleccionar un tipus de lletra adequat.
  2. Anar a Inserir > SÝmbol.
  3. Buscar el carÓcter adequat.
  4. Fer clic.

En el cas dels documents HTML, si l'editor ens ho permet, procedim com en el cas del Word. Si no ens ho permet, creem un document de Word auxiliar, i inserim els carÓcters desitjats i a continuaciˇ, copiant i enganxant, els posem en el document HTML. (No Ús recomanable converir un document de Word en un document HTML, ja que en el procÚs es genera molt codi incorrecte segons els criteris del W3C).

El problema d'inserir un carÓcter com un sÝmbol Ús que ens obliga a conŔixer el criteri d'ordenaciˇ dels carÓcters xinesos; altrament Ús com buscar una agulla en un paller.

 

Inserciˇ de carÓcters mitjanšant el codi Unicode

El codi Unicode aplega els carÓcters de tots els alfabets (llatÝ, grec, cirÝlĚlic, hebreu, Órab i les variants d'aquests), els carÓcters xinesos, japonesos (kanji, hiragana i katakana), coreans i del devanagari (hindi, etc.), i d'altres. A cada carÓcter hi correspon un codi. Aquests codis consisteixen en grups de carÓcters que es poden obtenir des de qualsevol teclat europeuelementals, i es poden formular de dues maneres, decimal i hexadecimal. Els dos primers carÓcters sˇn sempre '&#' i el darrer ';'. Entremig, un codi numŔric (format decimal) i una 'x' seguida d'un codi alfanumŔric (format hexadecimal). Per exemple:

好     好

 

Codis Unicode dels sÝmbols Pinyin

Sˇn els segŘents:

ā ā     ǎ ǎ
ē ē     ě ě
ī ī     ǐ ǐ
ō ō     ǒ ǒ
ū ū     ǔ ǔ
           
ǖ ǖ     ǘ ǘ
ǚ ǚ     ǜ ǜ

 

Codis Unicode dels carÓcters

Alguns diccionaris disponibles a Internet indiquen el codi Unicode dels carÓcters. Vegeu, per exemple, InstantSpeak Chinese, on, en posar el cursor damunt un carÓcter, en mostra el codi a la barra d'estat.

A mÚs, examinant el codi de qualsevol pÓgina HTML (Veure > Codi font o anÓleg), es pot observar el codi de qualsevol carÓcter xinŔs que contingui.

 

Lectura del documents

Finalment cal assegurar-se que l'ordinador amb quŔ es llegirÓ el document tÚ algun tipus de lletra que compti amb carÓcters xinesos, com ara l'Arial, l'Arial Unicode-MS, el PMingLiU, el Batang, etc. ╔s convenient adevertir-ne en els casos en quŔ no es pot pressuposar que aquests jocs de carÓcters es troban ja instalĚlats.