RíomhairíTeicneolaíocht faisnéise

Ionchódú "Unicode": carachtar caighdeánach códaithe

Gach úsáideoir an Idirlíon in iarracht a chur ar bun ceann amháin nó ceann eile a fheidhme a chonaic ar a laghad uair amháin ar an scáileán scríofa i litreacha Laidine an focal "Unicode." Cad é atá ann, beidh tú ag foghlaim trí léamh an alt seo.

sainmhíniú

Ionchódú "Unicode" - caighdeán ionchódú carachtar. Moladh ag Unicode Inc. eagraíocht neamhbhrabúis i 1991. Tá an caighdeán a ceapadh chun a thabhairt le chéile ar an líon is mó is féidir de chineálacha éagsúla de charachtair i ndoiciméad. Leathanach, a bunaíodh ar an mbonn sin, is féidir go bhfuil litreacha agus carachtair ó theangacha éagsúla (ó Rúisis go Cóiréis) agus comharthaí matamaiticiúla. Sa chás seo, gach ceann de na carachtair sa tacar carachtar ar taispeáint gan aon fhadhbanna.

Na cúiseanna leis an cruthú

Nuair ar am, i bhfad roimh an chuma ar chóras amháin go bhfuil "Unicode" ionchódú roghnú bunaithe ar na roghanna de an t-údar an doiciméid. Ar an gcúis sin, is minic le doiciméad a léamh, bhí sé riachtanach a bhaint as táblaí éagsúla. Uaireanta is gá a dhéanamh arís agus arís eile, atá casta go mór leis an saol ar an t-úsáideoir meán. Mar a luadh cheana, tugadh cuireadh don réiteach ar an fhadhb in 1991 go Unicode Inc. eagraíocht neamhbhrabúis a chur ar fáil i ndáil le cineál nua de ionchódú carachtar. Bhí sé deartha a chur le chéile as dáta agus éagsúlacht na caighdeáin. "Unicode" - an ionchódú ozvolila a bhaint amach ar an unthinkable ag an am: a chruthú uirlis a thacaíonn le líon mór de charachtair. Sháraigh an toradh go leor ag súil leis - bhí doiciméid ina bhfuil ag an am céanna i mBéarla agus an téacs Rúisis, Laidin, agus ar na téarmaí matamaitice.

Ach an cruthú de códaithe aontaithe roimh an gá atá le roinnt fadhbanna a tháinig chun cinn a réiteach mar gheall ar an éagsúlacht mhór na caighdeáin atá ann cheana ag an am sin. An ceann is coitianta acu:

  • scríbhneoireacht Elvish, nó "gibberish";
  • na srianta a bhaineann leis an tacar carachtar;
  • fhadhb Trasfhoirmigh codings;
  • dúbailt cló.

excursus stairiúil Beaga

Samhlaigh go bhfuil an clós 80. Níl an crua-earraí ríomhaire chomh coitianta agus tá foirm eile ó lá atá inniu ann. Cé go bhfuil gach OS uathúil agus scagadh riachtanais shonracha gach enthusiast ar. An riachtanas is gá chun faisnéis a mhalartú é thiontú i rud rework sa bhreis. Ag iarraidh le doiciméad cruthaithe ag córas oibriúcháin eile a léamh, is minic a thaispeánann sraith aisteach de charachtair, agus a thosaíonn an cluiche leis an ionchódú. Ní chuireann sé a dhéanamh i gcónaí go tapa, agus uaireanta doiciméad riachtanach Ní féidir a oscailt i sé mhí, agus fiú níos déanaí. Daoine a mhalartú go minic faisnéis, a chruthú dóibh féin ar tábla comhshó. Agus obair ansin ar nochtann dóibh mion suimiúil: an gá atá le chruthú dóibh sa dhá threo, "ó mo i do" anonn 's anall. Déan Ní féidir meaisín ríomhaireachta inbhéartaithe banal, chun é sa cholún ar dheis ar an bhfoinse, agus ar an taobh clé - an toradh, ach ní vice versa. Má fheiceann tú ar an ngá atá le húsáid le haon carachtair speisialta sa doiciméad, bhí siad a chur leis ar dtús, agus ansin, bealach eile, agus a mhíniú don pháirtí cad is gá dó a dhéanamh chun na carachtair nach bhfuil a bheith ina "gibberish." Agus ná déanaimis dearmad go bhfuil faoi raibh gach ionchódú a fhorbairt nó a n-clónna féin, rud ba chúis le cruthú de líon mór de dúblaigh sa OS a chur chun feidhme.

Samhlaigh chomh maith go na clónna ar an leathanach, beidh tú a fheiceáil 10 píosaí de comhionann Times New Roman le beag Nóta: chun UTF-8, UTF-16, ANSI, UCS-2. Anois go dtuigeann tú go raibh forbairt caighdeán uilíoch riachtanach?

"Bunaitheoirí na creators"

An bunús chruthú Unicode le fáil i 1987 nuair a thosaigh Joe Becker ó Xerox, mar aon le Lee Collins agus Mark Davis ó Apple taighde i réimse na chruthú praiticiúil sraith charachtar uilíoch. I mí Lúnasa 1988, d'fhoilsigh Dzho Bekker dréacht-togra do chruthú 16-giotán ilteangach córas códaithe idirnáisiúnta.

Tar éis cúpla mí Leathnaíodh grúpa oibre Unicode a chur san áireamh Ken Whistler agus Mike Kernegana ó RLG, Glenn Wright na Sun Microsystems agus speisialtóirí eile a roinnt, ar chumas an obair a chríochnú ar an réamh ghlóthach a chaighdeán códaithe coiteann.

tuairisc ghinearálta

An Unicode bunaithe ar an gcoincheap an tsiombail. De réir Tagraíonn an sainmhíniú sin feiniméan teibí atá ann i bhfoirm áirithe scríbhneoireachta agus thuig trí grapheme (a "portráidí"). Tá gach carachtar a thugtar sa "Unicode" cód uathúil nach a bhaineann le caighdeán aonad ar leith. Is Eg grapheme B freisin i mBéarla agus aibítrí Rúisis, ach freagraíonn sé seo do Unicode 2 carachtair éagsúla. Tá siad faoi réir ag aistriú chun an cás íochtair, t. E., gach ceann de a chuireann síos ar bhunachar sonraí eochracha leis, sraith de airíonna agus an t-ainm iomlán.

Buntáistí a bhaineann le Unicode

Ó lucht comhaimsire eile ionchódú "Unicode" Tá stoic ollmhór comharthaí do charachtair "criptithe". Ós rud é go raibh a réamhtheachtaithe 8 giotán, is é sin le tacaíocht ó 28 carachtair, ach bhí an dearadh nua cheana 216 carachtair, go raibh Céim mhór chun tosaigh. Seo ionchódú a cheadaítear beagnach gach na haibítrí atá ann cheana agus coitianta.

Le teacht na "Unicode" a thuilleadh gá a úsáid tábla comhshó: mar chaighdeán amháin deireadh leis sé ach an gá dóibh. Mar an gcéanna, tá siad chuaigh i oblivion, agus "gibberish" - caighdeán amháin a rinneadh dodhéanta iad, chomh maith le riail amach an ngá a chruthú clónna dhúbailt.

forbairt Unicode

Ar ndóigh, nach bhfuil an dul chun cinn atá i bhfeidhm, agus ós rud é go bhfuil an chéad chur i láthair a rith ar feadh 25 bliain. Mar sin féin, charset "Unicode" Coinníonn stubbornly a seasamh ar fud an domhain. I go leor bealaí go bhfuil sé sin déanta bhuíochas sin is féidir leis an bhfíric go bhfuil sé a bheith éasca a chur i bhfeidhm agus a scaipeadh, a bheith forbróirí dílseánaigh (íoctha) agus oscailte bogearraí foinse aitheanta.

Níor chóir dúinn a chreidiúint, go lá atá inniu ann muid ag fheiceáil mar an gcéanna cód "Unicode" mar an ceathrú cuid de agus céad bliain ó shin. I láthair na huaire, bhí sé in ionad an leagan 5.h.h, agus tá líon na siombailí códaithe a mhéadú go dtí 231. Ar an bhféidearthacht úsáid a bhaint lamháil níos mó marcanna dhiúltaigh a choimeád ar bun go fóill tacaíocht a thabhairt do Unicode-16 (ionchódú, i gcás an t-uasmhéid a líon teoranta 216). Ó bunaíodh é agus suas go dtí leagan 2.0.0 Tá "The Caighdeán Unicode" méadú ar líon na carachtair a bhí sé beagnach i 2 uair. deiseanna agus fás leanúnach sna blianta amach romhainn. Mar Leagan 4.0.0 cheana ann é sin gá le méadú ar an gcaighdeán féin, agus go raibh sé déanta. Mar thoradh air sin, tá "Unicode" fuair an fhoirm ina a fhios againn inniu.

Cad eile atá i Unicode?

Chomh maith leis an ollmhór, dáta i gcónaí le líon na gcarachtar, "Unicode" -Encoding faisnéis téacs Is tréith úsáideach eile. Is é seo an normalú mar a thugtar air. In áit a bheith scrollbharra tríd an carachtar doiciméad ar fad ag carachtar, agus in ionad na deilbhíní an dtábla comhfhreagrais, úsáid a bhaint as ceann amháin de na halgartaim normalú ann cheana. Cad é atá ann?

In ionad wasting acmhainní an ríomhaire ar seiceáil rialta ar an carachtar céanna, d'fhéadfadh a bheith den chineál céanna i aibítreacha éagsúla, ag baint úsáide as algartam speisialta. Ceadaíonn sé duit a dhéanamh siombailí den chineál céanna ar leith tábla colún a chuardach agus a dhéanann cheana féin leo, ní arís agus arís eile a athsheiceáil na sonraí.

halgartaim den sórt sin a fhorbairt agus ceithre a chur i bhfeidhm. Glacann gach comhshó ar siúl ar phrionsabal sainmhínithe go docht, difriúil ó na cinn eile, agus mar sin glaoch ar aon cheann acu nach bhfuil an is éifeachtaí is féidir. Gach a ceapadh le haghaidh sonracha riachtanais, neadaíodh agus a úsáidtear go rathúil.

caighdeán Scaipeadh

Sna 25 bliain ar a stair ionchódú "Unicode" a fuair mé dócha go bhfuil an chuid is mó forleithne ar fud an domhain. Faoin gcaighdeán a choigeartú mar chláir agus leathanaigh idirlín. Is féidir leis an leithead an t-iarratas in iúl go Unicode in úsáid anois ag níos mó ná 60% na n-acmhainní Idirlín.

Anois, tá a fhios agat, nuair a tháinig an "Unicode" caighdeánach. Cad é atá ann, tá a fhios agat chomh maith agus a bheith in ann a thuiscint an tábhacht iomlán an aireagán, rinne grúpa de dhaoine gairmiúla Unicode Inc. Níos mó ná 25 bliain ó shin.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ga.birmiss.com. Theme powered by WordPress.