Bilag - Tegnsæt
Indholdsfortegnelse
1. Indledning
Nærværende dokument beskriver det fælles tegnsæt det er tilladt at anvende i GCTP ajourførings-services.
2. Tilladt tegnsæt
I forbindelse med indberetning af data til CPR gennem GCTP services, er der en lang række felter som kan indeholde fritekst, såsom eksempelvis noter, udlandsadresser, kommunale notater med flere.
Tilsvarende findes der felter der indeholde mere struktureret tekster i form af navne, vejnavne, myndigheder med flere.
Fælles for alle disse felter er at der gælder et regelsæt, om hvilke tegn det er tilladt at sende ind via GCTP. Udover dette generelle regelsæt kan der sagtens være yderligere regelsæt, som indskrænker de tilladte tegn. Dette gælder for det meste de strukturerede fritekst felter, og vil være oplyst i dokumentationen for de individuelle GCTP services.
Det generelle tilladte regelsæt for alle felter er angivet herunder.
- Det danske tegnsæt a-å og A-Å
- Tal 0-9
- Blanktegn
- Udvidet tegnsæt
- Specialtegn
2.1. Navne tegnsæt
Specifikt for navne felter gælder der et begrænset regelsæt ift. det tilladte tegnsæt.
Regelsættet for navne felter er angivet herunder.
- Det danske tegnsæt a-å og A-Å
- Blanktegn
- Udvidet tegnsæt
- Specialtegn - '
2.2. Navnesøgning tegnsæt
Specifikt for navne felter gælder der et begrænset regelsæt ift. det tilladte tegnsæt.
Regelsættet for navne felter er angivet herunder.
- Det danske tegnsæt a-å og A-Å
- Blanktegn
- Udvidet tegnsæt
- Specialtegn - ' _
2.3. Adresseringsnavn tegnsæt
Specifikt for adresseringsnavn felter gælder der et begrænset regelsæt ift. det tilladte tegnsæt.
- Det danske tegnsæt a-å og A-Å
- Blanktegn
- Udvidet tegnsæt
- Specialtegn , - '
2.4. C/o tegnsæt
Specifikt for c/o felter gælder der et begrænset regelsæt ift. det tilladte tegnsæt.
Reglesættet for c/o felter er angivet herunder, og er opdelt i to dele. Regelsættet evalueres kun på den del af feltets værdi, som kommer efter et evt. "c/o "-præfiks. Da det er en forretningsregel, at et c/o felt altid skal starte med værdien "c/o ", bliver en sådan værdi ikke medregnet i tegnæsttets regelsæt - i stedet håndhæves denne forretningsregel igennem andre valideringer i systemet.
2.4.1. Første tegn
For det første tegen der kommer efter et "c/o "-præfiks gælder følgende regelsæt.
- Det danske tegnsæt a-å og A-Å
- Udvidet tegnsæt
2.4.2. Alle tegn efter første
For alle resterende tegen efter det første, som kommer efter et "c/o "-præfiks, gælder følgende regelsæt.
- Det danske tegnsæt a-å og A-Å
- Tal 0-9
- Udvidet tegnsæt
- Specialtegn . , - ' / ( ) & *
- Blanktegn
2.5. BNR tegnsæt
Specifikt for BNR (bygningsnummer) felter gælder der et begrænset regelsæt ift. det tilladte tegnsæt.
Regelsættet for BNR felter er angivet herunder.
- Det danske tegnsæt a-å og A-Å
- Tal 0-9
2.6. Vejnavn tegnsæt
Specifikt for felter til aktuelle vejnavne og vejadresseringsnavne gælder der et begrænset regelsæt ift. det tilladte tegnsæt.
- Det danske tegnsæt a-å og A-Å
- Tal 0-9
- äéöüÄÉÖÜ
- Specialtegn . - '
- Blanktegn
2.7. Myndighedstekst tegnsæt
Dette tegnsæt henvender sig til navngivende tekster på myndigheder. Der gælder et begrænset regelsæt ift. det tilladte tegnsæt.
- Det danske tegnsæt a-å og A-Å
- Tal 0-9
- Udvidet tegnsæt
- Blanktegn
- Specialtegn . , - ' / ( ) & *
Derudover skal det først tegn i teksten være fra det danske tegnsæt.
2.8. Adresse tegnsæt
Dette tegnsæt er rettet mod adressefelter. Der gælder et begrænset sæt regler for det tilladte tegnsæt.
- Det danske tegnsæt a-å og A-Å
- Tal 0-9
- Udvidet tegnsæt
- Blanktegn
- Specialtegn . , - ' / ( ) & *
Derudover skal det første tegn i teksten være fra det danske tegnsæt eller et ciffer.
2.9. CPRNyt tegnsæt
Dette tegnsæt henvender sig til ledetekster på CPRNyt beskeder. Der gælder et begrænset regelsæt ift. det tilladte tegnsæt.
- Det danske tegnsæt a-å og A-Å
- Tal 0-9
- Udvidet tegnsæt
- Blanktegn
- Specialtegn . , - ' / ( ) & * §
2.10. Udvidet tegnsæt
Det udvidet tegnsæt, tillader en større mængde internationale bogstaver, som er vist herunder.
Bogstaverne er opdelt efter deres unicode nummer, der svarer til en UTF-16 big-endian hex-kode, hvor rækken definerer de tre hex værdier, og kolonnen definere den fjerde hex værdi.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+00C_ | À | Á | Â | Ã | Ä | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï | ||
U+00D_ | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | Ù | Ú | Û | Ü | Ý | Þ | ß | ||
U+00E_ | à | á | â | ã | ä | ç | è | é | ê | ë | ì | í | î | ï | ||
U+00F_ | ð | ñ | ò | ó | ô | õ | ö | ù | ú | û | ü | ý | þ | ÿ | ||
U+017_ | Ÿ |
2.11. Specialtegn
Det generelle reglsæt tillader de mest hyppige specialtegn, som er vist herunder.
Specialtegnene er opdelt efter deres unicode nummer, der svarer til en UTF-16 big-endian hex-kode, hvor rækken definerer de tre hex værdier, og kolonnen definere den fjerde hex værdi.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+002_ | ! | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / | ||
U+003_ | = | ? | ||||||||||||||
U+005_ | \ | |||||||||||||||
U+007_ | { | | | } | ~ | ||||||||||||
U+00A_ | § |
3. Formatering af navne i tegnsæt
Hvis et navn sendes ind til services der behandler navne uden stavefrihed, vil navnedelene blive oversat således at første tegn i den enkelte navnedel laves om til stort bogstav.
Der er undtagelse til navnedele hvor der ikke laves stort bogstav, f.eks. von og der. Dette gælder dog udelukkende navnedele som ikke er første fornavn eller sidste efternavn.
Følgende navnedele er undtagelser : 'á' , 'í', 'y', 'av' , 'da', ,de' , 'di' , 'du', 'la' , 'le', 'te', 'úr', 'zu', 'das' , 'del' , 'den', 'der' , 'des' , 'dos' , 'los' , 'ten', 'ter' , 'van' , 'við' , 'von' , 'zum', 'millum' , 'undir'
Bindestreger behandles som mellemrum og en navnedels deler således at Hans-Henrik opfattes som to navnedele, men behandles som en navnedel. Det betyder også at første bogstav efter bindestregen altid vil blive oversat til stort bogstav, med mindre der er tale om en af ovenstående undtagelser.
Bemærk at man altid vil kunne vælge Stavefrihed til at der ikke laves nogen konvertering og navnene vil blive gemt som indsendt.
Eksempel på formateringer
Indberetning navn : Hans von der Kleisner , vil blive til Hans von der Kleisner
Indberetning navn : von der Kleisner , vil blive til Von der Kleisner
Indberetning navn : Lars der von , vil blive til Lars der von
Indberetning navn : lars von de graaf , vil blive til Lars von de Graaf
Indberetning navn : Hans-henrik poul-der graaf, vil blive til Hans-Henrik Poul-der Graff
4. Fejlkode
Såfremt man indsender en tekst i et fritekst eller struktureret fritekst felt, hvor der indgår et tegn som ikke er indeholdt i ovenstående værdimængde, vil systemet returnere en GCTP kvittering med en fejl.
Kvitteringsnummer | Kvitteringstekst |
---|---|
63 | Feltet skal indeholde gyldige bogstaver, tegn og blanke |
4.1. Tegnsætspecifikke fejlkoder
Der kan forekomme specifikke fejlkoder for nogle af de konkrete tegnsæt, som ikke indgår i regelsættet for det generelle tegnsæt.
Tegnsæt | Kvitteringsnummer | Kvitteringstekst |
---|---|---|
c/o | 38 | C/0-navn skal indholde gyldige bogstaver, tegn og tal. |
BNR | 68 | Feltet skal indeholde gyldige bogstaver, tegn og blanke |
5. Eksempler
Gyldige tekster
Indberetning af stilling : § Rytter
Indberetning af stilling : $ Magnet
Indberetning af stilling : Gas & Varmemester
Indberetning af kommunalt notat: {1} Notatline !
Indberetning af navn: $$$
Ugyldige tekster
Indberetning af stilling : "§ Rytter" (Tegnet " er ikke tilladt)
Indberetning af stilling : £ Magnet (Tegnet £ er ikke tilladt)
Indberetning af stilling : Maler [Kunst] (Tegnene [ og ] er ikke tilladt)
Indberetning af kommunalt notat: _ Linie1 (Tegnet _ er ikke tilladt)
v1.0.14