Syntax och parsing

Med syntax och parsing menas att det finns en ordning av regler som beskriver hur alla attribut och märken ska behandlas och placeras. Medan syntaxen i HTML klarar sig någorlunda galant trots eventuella fel, kan ett enda syntaxfel i XML och/eller XHTML leda till fatala errors. Eftersom XHTML använder de krav som krävs av en xml-parsing innebär ett syntaxfel att webläsaren och parsen inte kan läsa in eller förstå koderna på rätt sätt.

De vanligaste parsingfelen

Den som är nybörjare kan i många stycken ha det lättare att skriva XHTML då inte gamla och ingrodda vanor påverkar tanken, men det behöver givetvis inte alltid vara så. Problemen som uppkommer beror just på att man måste tänka om lite grann, och ibland tänka lite bakvänt. Det är lätt att koda fel i bara farten, tyvärr så blir det då också samma fart på webbläsaren när dokumentet har skickats upp på nätet, och det vill vi ju inte. De vanligaste felen som görs är följande:

  1. okodade ampersands, det vill säga att man använder ett & istället för &
  2. < istället &lt;
  3. man har glömt att stänga någon tagg
  4. oväntade (skriv)tecken som återfinns i eller före attributnamnen
  5. oväntade (skriv)tecken som finns före Doctype
  6. att glömma doctype helt och hållet eller ange fel doctype
  7. att glömma namespace
  8. oväntade sluttaggar eller felaktigt skrivna sluttaggar
  9. glömda sluttaggar
  10. flera body och head
  11. felaktigt definierade attribut eller element
  12. att använda märken eller attribut som inte är tillåtna
  13. att använda andra programspråk, t ex css, direkt i märkspråket (fulhtml)

Syntax

Ett parsingfel uppstår alltså vid en felaktig skriven syntax. Hur ser då en “well formed” – väl utförd – syntax ut?

  1. relevant doctype
  2. en namespacedeklaration
  3. i XHTML är alla attribut och “tag-names” case sensitive – de ska med andra ord skrivas med små bokstäver
  4. de element som inte är tomma märken ska både ha en starttagg och en sluttag
  5. det får bara finnas 1 html, 1 head och 1 body i dokumentet
  6. man måste sätta en sluttagg på ol, ul och framförallt li
  7. man måste ange en sluttagg på dd samt dt
  8. alla styckeformateringar måste anslutas med en tagg (/p)
  9. man måste sätta en sluttag i följande märkningar: thead, th, tr, td och tfoot
  10. i tbody samt i colgroup krävs både båda taggarna
  11. tomma element avslutas i sig själv, ex <br />, <img />, <hr />
  12. ge akt på blanksteget mellan märket och slashen
  13. ett tomt märke är något som har ett värde i sig själv och inte behöver definieras, omsluts av 1 start-sluttagg
  14. man anger bildinformation i alt-taggen
  15. man avslutar koden till en bild med en slash precis innan sluttaggen; <img src=”bild.jpg” alt=”info om bilden” />
  16. man måste definiera attributen, aldrig förkorta dem
  17. används script måste man lägga dem i CDATA-avsnitt
  18. man använder märkena till sådant som de är definierade, ex h1-h6 är rubriker, p ger styckeindelningar, li listor osv (semantik)
  19. man strukturerar dokumentet i en “rätt och logisk” ordning

Mimetypes

XHTML måste ha en mimetyp som också refererar till XML, antingen application/xml eller application/xhtml+xml. Om du använder fel mimetype och levererar din XHTML i textformatet text/html (vilket jag sett att många tyvärr gör) så orsakar det oftast fel och den data du egentligen levererar till webbläsaren är inte XHTML utan HTML – tänk på det.
Mer ingående information finns i respektive guide.

Liknande poster:

Leave a Reply

Your email address will not be published. Required fields are marked *