Bilag - Tegnsæt

Indholdsfortegnelse

1. Indledning

Nærværende dokument beskriver det fælles tegnsæt det er tilladt at anvende i GCTP ajourførings-services.

2. Tilladt tegnsæt

I forbindelse med indberetning af data til CPR gennem GCTP services, er der en lang række felter som kan indeholde fritekst, såsom eksempelvis noter, udlandsadresser, kommunale notater med flere.

Tilsvarende findes der felter der indeholde mere struktureret tekster i form af navne, vejnavne, myndigheder med flere.

Fælles for alle disse felter er at der gælder et regelsæt, om hvilke tegn det er tilladt at sende ind via GCTP. Udover dette generelle regelsæt kan der sagtens være yderligere regelsæt, som indskrænker de tilladte tegn. Dette gælder for det meste de strukturerede fritekst felter, og vil være oplyst i dokumentationen for de individuelle GCTP services.

Det generelle tilladte regelsæt for alle felter er angivet herunder.

  • Det danske tegnsæt a-å og A-Å
  • Tal 0-9
  • Blanktegn
  • Udvidet tegnsæt
  • Specialtegn

2.1. Navne tegnsæt

Specifikt for navne felter gælder der et begrænset regelsæt ift. det tilladte tegnsæt.

Regelsættet for navne felter er angivet herunder.

  • Det danske tegnsæt a-å og A-Å
  • Blanktegn
  • Udvidet tegnsæt
  • Specialtegn - '

2.2. Navnesøgning tegnsæt

Specifikt for navne felter gælder der et begrænset regelsæt ift. det tilladte tegnsæt.

Regelsættet for navne felter er angivet herunder.

  • Det danske tegnsæt a-å og A-Å
  • Blanktegn
  • Udvidet tegnsæt
  • Specialtegn - ' _

2.3. Adresseringsnavn tegnsæt

Specifikt for adresseringsnavn felter gælder der et begrænset regelsæt ift. det tilladte tegnsæt.

  • Det danske tegnsæt a-å og A-Å
  • Blanktegn
  • Udvidet tegnsæt
  • Specialtegn , - '

2.4. C/o tegnsæt

Specifikt for c/o felter gælder der et begrænset regelsæt ift. det tilladte tegnsæt.

Reglesættet for c/o felter er angivet herunder, og er opdelt i to dele. Regelsættet evalueres kun på den del af feltets værdi, som kommer efter et evt. "c/o "-præfiks. Da det er en forretningsregel, at et c/o felt altid skal starte med værdien "c/o ", bliver en sådan værdi ikke medregnet i tegnæsttets regelsæt - i stedet håndhæves denne forretningsregel igennem andre valideringer i systemet.

2.4.1. Første tegn

For det første tegen der kommer efter et "c/o "-præfiks gælder følgende regelsæt.

  • Det danske tegnsæt a-å og A-Å
  • Udvidet tegnsæt

2.4.2. Alle tegn efter første

For alle resterende tegen efter det første, som kommer efter et "c/o "-præfiks, gælder følgende regelsæt.

  • Det danske tegnsæt a-å og A-Å
  • Tal 0-9
  • Udvidet tegnsæt
  • Specialtegn . , - ' / ( ) & *
  • Blanktegn

2.5. BNR tegnsæt

Specifikt for BNR (bygningsnummer) felter gælder der et begrænset regelsæt ift. det tilladte tegnsæt.

Regelsættet for BNR felter er angivet herunder.

  • Det danske tegnsæt a-å og A-Å
  • Tal 0-9

2.6. Vejnavn tegnsæt

Specifikt for felter til aktuelle vejnavne og vejadresseringsnavne gælder der et begrænset regelsæt ift. det tilladte tegnsæt.

  • Det danske tegnsæt a-å og A-Å
  • Tal 0-9
  • äéöüÄÉÖÜ
  • Specialtegn . - '
  • Blanktegn

2.7. Myndighedstekst tegnsæt

Dette tegnsæt henvender sig til navngivende tekster på myndigheder. Der gælder et begrænset regelsæt ift. det tilladte tegnsæt.

  • Det danske tegnsæt a-å og A-Å
  • Tal 0-9
  • Udvidet tegnsæt
  • Blanktegn
  • Specialtegn . , - ' / ( ) & *

Derudover skal det først tegn i teksten være fra det danske tegnsæt.

2.8. Adresse tegnsæt

Dette tegnsæt er rettet mod adressefelter. Der gælder et begrænset sæt regler for det tilladte tegnsæt.

  • Det danske tegnsæt a-å og A-Å
  • Tal 0-9
  • Udvidet tegnsæt
  • Blanktegn
  • Specialtegn . , - ' / ( ) & *

Derudover skal det første tegn i teksten være fra det danske tegnsæt eller et ciffer.

2.9. CPRNyt tegnsæt

Dette tegnsæt henvender sig til ledetekster på CPRNyt beskeder. Der gælder et begrænset regelsæt ift. det tilladte tegnsæt.

  • Det danske tegnsæt a-å og A-Å
  • Tal 0-9
  • Udvidet tegnsæt
  • Blanktegn
  • Specialtegn . , - ' / ( ) & * §

2.10. Udvidet tegnsæt

Det udvidet tegnsæt, tillader en større mængde internationale bogstaver, som er vist herunder.

Bogstaverne er opdelt efter deres unicode nummer, der svarer til en UTF-16 big-endian hex-kode, hvor rækken definerer de tre hex værdier, og kolonnen definere den fjerde hex værdi.

Table 1. Tilladte udenlandske bogstaver (opdelt efter unicode nummer)
0123456789ABCDEF
U+00C_ÀÁÂÃÄÇÈÉÊËÌÍÎÏ
U+00D_ÐÑÒÓÔÕÖÙÚÛÜÝÞß
U+00E_àáâãäçèéêëìíîï
U+00F_ðñòóôõöùúûüýþÿ
U+017_Ÿ

2.11. Specialtegn

Det generelle reglsæt tillader de mest hyppige specialtegn, som er vist herunder.

Specialtegnene er opdelt efter deres unicode nummer, der svarer til en UTF-16 big-endian hex-kode, hvor rækken definerer de tre hex værdier, og kolonnen definere den fjerde hex værdi.

Table 2. Tilladte specialtegn (opdelt efter unicode nummer)
0123456789ABCDEF
U+002_!#$%&'()*+,-./
U+003_=?
U+005_\
U+007_{|}~
U+00A_§

3. Formatering af navne i tegnsæt

Hvis et navn sendes ind til services der behandler navne uden stavefrihed, vil navnedelene blive oversat således at første tegn i den enkelte navnedel laves om til stort bogstav.

Der er undtagelse til navnedele hvor der ikke laves stort bogstav, f.eks. von og der. Dette gælder dog udelukkende navnedele som ikke er første fornavn eller sidste efternavn.

Følgende navnedele er undtagelser : 'á' , 'í', 'y', 'av' , 'da', ,de' , 'di' , 'du', 'la' , 'le', 'te', 'úr', 'zu', 'das' , 'del' , 'den', 'der' , 'des' , 'dos' , 'los' , 'ten', 'ter' , 'van' , 'við' , 'von' , 'zum', 'millum' , 'undir'

Bindestreger behandles som mellemrum og en navnedels deler således at Hans-Henrik opfattes som to navnedele, men behandles som en navnedel. Det betyder også at første bogstav efter bindestregen altid vil blive oversat til stort bogstav, med mindre der er tale om en af ovenstående undtagelser.

Bemærk at man altid vil kunne vælge Stavefrihed til at der ikke laves nogen konvertering og navnene vil blive gemt som indsendt.

Eksempel på formateringer

Indberetning navn : Hans von der Kleisner , vil blive til Hans von der Kleisner

Indberetning navn : von der Kleisner , vil blive til Von der Kleisner

Indberetning navn : Lars der von , vil blive til Lars der von

Indberetning navn : lars von de graaf , vil blive til Lars von de Graaf

Indberetning navn : Hans-henrik poul-der graaf, vil blive til Hans-Henrik Poul-der Graff

4. Fejlkode

Såfremt man indsender en tekst i et fritekst eller struktureret fritekst felt, hvor der indgår et tegn som ikke er indeholdt i ovenstående værdimængde, vil systemet returnere en GCTP kvittering med en fejl.

Table 3. GCTP fejl ved ugyldig tegn
KvitteringsnummerKvitteringstekst
63Feltet skal indeholde gyldige bogstaver, tegn og blanke

4.1. Tegnsætspecifikke fejlkoder

Der kan forekomme specifikke fejlkoder for nogle af de konkrete tegnsæt, som ikke indgår i regelsættet for det generelle tegnsæt.

Table 4. GCTP fejl ved ugyldig tegn i konkrete tegnsæt
TegnsætKvitteringsnummerKvitteringstekst
c/o38C/0-navn skal indholde gyldige bogstaver, tegn og tal.
BNR68Feltet skal indeholde gyldige bogstaver, tegn og blanke

5. Eksempler

Gyldige tekster

Indberetning af stilling : § Rytter

Indberetning af stilling : $ Magnet

Indberetning af stilling : Gas & Varmemester

Indberetning af kommunalt notat: {1} Notatline !

Indberetning af navn: $$$

Ugyldige tekster

Indberetning af stilling : "§ Rytter" (Tegnet " er ikke tilladt)

Indberetning af stilling : £ Magnet (Tegnet £ er ikke tilladt)

Indberetning af stilling : Maler [Kunst] (Tegnene [ og ] er ikke tilladt)

Indberetning af kommunalt notat: _ Linie1 (Tegnet _ er ikke tilladt)

v1.0.5