Vandræði með rafrænan póst


Höfundur
Garri
1+1=10
Póstar: 1109
Skráði sig: Lau 31. Okt 2009 21:34
Reputation: 3
Staðsetning: Akureyri
Hafðu samband:
Staða: Ótengdur

Vandræði með rafrænan póst

Pósturaf Garri » Fim 16. Jan 2014 13:06

Sælir

Er með allskonar hugbúnað sem ég hef smíðað. Flest þessara kerfa geta sent póst (email). Málið er, ef ég nota sér-íslensku stafina þá fær pósturinn þessa athugasemd:

MIME_BAD_ISO_CHARSET 2.83, SUBJECT_NEEDS_ENCODING 1.28, TVD_PDF_FINGER01 1.00

Jan 16 11:03:12 vxout-2 MailScanner[25376]: Message 9F459833268.0E778 from xxx.xxx.xxx.xxx (xxxxxx@internet.is) to vodafone.is is Ruslpostur, SpamAssassin (not cached, stigagjof=6.108, required 5, autolearn=disabled, MIME_BAD_ISO_CHARSET 2.83, SUBJECT_NEEDS_ENCODING 1.28, TVD_PDF_FINGER01 1.00, TVD_SPACE_RATIO 1.00)

Fæ mínusa út á

1 -2.83 MIME_BAD_ISO_CHARSET 2.83
2 -1.28 SUBJECT_NEEDS_ENCODING
3 -1.00 TVD_PDF_FINGER01
4 -1.00 TVD_SPACE_RATIO

Prófaði að encoda þetta í UTF8 en þá fæ ég garbis í stað séríslensku stafa.. einhver sem veit eitthvað um þetta?

Edit: Prófaði að forca 8859_1 í charset..




cartman
has spoken...
Póstar: 172
Skráði sig: Sun 11. Des 2011 14:01
Reputation: 3
Staða: Ótengdur

Re: Vandræði með rafrænan póst

Pósturaf cartman » Fim 16. Jan 2014 13:26

Hefur þú prófað annað character set eins og t.d. iso 8859-1?




Höfundur
Garri
1+1=10
Póstar: 1109
Skráði sig: Lau 31. Okt 2009 21:34
Reputation: 3
Staðsetning: Akureyri
Hafðu samband:
Staða: Ótengdur

Re: Vandræði með rafrænan póst

Pósturaf Garri » Fim 16. Jan 2014 13:32

cartman skrifaði:Hefur þú prófað annað character set eins og t.d. iso 8859-1?

Var einmitt að prófa það.. sjá hér að ofan í Edit. Getur verið að ég þurfi að gera þetta handvirkt, en componentið sem ég nota er ævagamalt.. frá 1998.

En aðallega vantar mig að vita hvaða charset ég á að nota. Er að bíða eftir svari frá Vodafone með það, þeir hljóta að vita það.

Veist þú eitthvað hvað hinir mínusarnir fyrirstilla?



Skjámynd

Daz
Besserwisser
Póstar: 3835
Skráði sig: Sun 20. Okt 2002 09:35
Reputation: 157
Staðsetning: Somewhere something went horribly wrong
Staða: Ótengdur

Re: Vandræði með rafrænan póst

Pósturaf Daz » Fim 16. Jan 2014 14:57

Giskandi pínulítið út í loftið (ég hef oft lent í stafasetta vandamálum, sem ég hef ekki alltaf náð að leysa fallega. Þetta er svona hugmynd sem mér var að detta í hug) en þegar þú encodar í UTF8, getur verið að strengurinn sem kemur inn sé ekki á sama formi (stafasetti) og encoderinn heldur? Þá encodast augljóslega íslensku táknin í röng UTF8 tákn. Til að vera viss um það þyrftirðu að skoða binary/hexa formið sem input strengurinn er í, til að athuga hvaða bitar liggja bak við íslensku stafina.




Höfundur
Garri
1+1=10
Póstar: 1109
Skráði sig: Lau 31. Okt 2009 21:34
Reputation: 3
Staðsetning: Akureyri
Hafðu samband:
Staða: Ótengdur

Re: Vandræði með rafrænan póst

Pósturaf Garri » Fim 16. Jan 2014 15:21

Daz skrifaði:Giskandi pínulítið út í loftið (ég hef oft lent í stafasetta vandamálum, sem ég hef ekki alltaf náð að leysa fallega. Þetta er svona hugmynd sem mér var að detta í hug) en þegar þú encodar í UTF8, getur verið að strengurinn sem kemur inn sé ekki á sama formi (stafasetti) og encoderinn heldur? Þá encodast augljóslega íslensku táknin í röng UTF8 tákn. Til að vera viss um það þyrftirðu að skoða binary/hexa formið sem input strengurinn er í, til að athuga hvaða bitar liggja bak við íslensku stafina.

Sæll

Búinn að leysa þetta.. componentið sem ég var að nota (reyndar aðeins í rönntæm) var með properties sem heitir, charset. Það var sett default við "creation" sem "ANSI_CHARSET" og það í textastreng. Með því setja þetta properties í "ISO-8859-1" þá snarhætti að koma mínusar og skv. þjónustumanni sem ritaði: "Mér sýnist þetta vera komið í lag núna þetta er allavega ekkert tékkað í okkar síum núna og engin stig sem koma. "

Ég þurfti m.ö.o. ekkert að hand-konverta strengjum í UTF-8 unicode eða í eitthvað annað. Enda bjóst ég svo sem við því, var bara ekki viss á hvaða charset ég ætti að nota með séríslenskum stöfum. "ANSI_CHARSET" virkar greinilega ekki.

Edit: Var að forvitnast og notaði Gúgul aðeins, fann þetta fljótlega:

Emails are tricky. There’s so many legacy systems to keep track of.

Google Mail does it this way:

  1. Detect character encoding
  2. If it’s ASCII, leave as ASCII
  3. If it’s ISO-8859-1, deliver as ISO-8859-1/quoted printable
  4. If it’s UTF-8, but only contains characters that could also be displayed as ISO-8859-1, convert to and deliver as ISO-8859-1/quoted printable.
  5. If it’s UTF-8, deliver as UTF-8/base64

That’s neat, the system tries progressively newer encodings that are progressively more functional, but also more likely to break. The oldest encoding with the least necessary functionality, which also is the most compatible, is used.