web-dev-qa-db-de.com

Was ist "= C2 = A0" in MIME-codiertem, in Anführungszeichen gesetztem druckbarem Text?

Dies ist eine Beispiel-Roh-E-Mail, die ich zu analysieren versuche:

MIME-version: 1.0
Content-type: text/html; charset=UTF-8
Content-transfer-encoding: quoted-printable
X-Mailer: Verizon Webmail
X-Originating-IP: [x.x.x.x]

=C2=A0test testing testing 123

Was ist = C2 = A0? Ich habe ein halbes Dutzend Parser ausprobiert, die in Anführungszeichen stehen. Wie würde man das in C # richtig analysieren?

Im Moment programmiere ich:

//TODO WTF
encoded = encoded.Replace("=C2=A0", "");

Weil ich nicht herausfinden kann, warum dieser Text zufällig im MIME-Inhalt enthalten ist und in nichts gerendert werden soll. Wenn ich es nur entferne, erhalte ich den gewünschten Effekt - aber WARUM ?!

Um klar zu sein, ich weiß, dass (= [0-9A-F] {2}) ein codiertes Zeichen ist. Aber in diesem Fall repräsentiert es scheinbar NICHTS.

51
TheSoftwareJedi

"= C2 = A0" repräsentiert die Bytes C2 A0. Da dies jedoch UTF-8 ist, wird es in 00A0 übersetzt, was Unicode für nicht unterbrechenden Speicherplatz ist.

Siehe TF-8 (Wikipedia).

92
Steven Sudit