Jakob Lenfers schrieb:
[...]
Post by Jakob LenfersIch möchte für ein Projekt einen Converter von BibTex in normal
lesbaren Text machen. Dieser Text soll dann mit Hilfe von struts und
Tomcat in einer Webanwendung dargestellt werden. Diese Webanwendung
sollte in UTF-8 darstellen, da ich denke, dass das die höchste
Zeichenvielfalt erlaubt und weit unterstützt ist.
In dem Converter muss ich aus {\~o} ein õ machen. (Ich hoffe es wird
· Das ersetzen ist ja kein Problem. Aber wie erstelle ich einen String
mit dem õ, am besten indem ich den UTF-8-Code eingebe?
zum Beispiel, ja. \u00F5; Oder du gibst alle Zeichen in Unicode in einen
Textdatei ein und covnertierst sie mit einem kleinem JavaProgramm in die
\uxxx;-Notation. Oder, du lässt die Datei wie sie ist und benutzt sie
direkt für das Mapping, dann baust du dir halt eine liste auf. Einmal
einlesen, zum Beispiel in deinen String oder ein char[] und fertig..
zumindest solange man keine 2 chars für diese Zeichen braucht ;) Aber
für die Fälle kannst du ja eine tweite Liste machen. Du kannst auch das
Mapping dort komplett reinschreiben anstatt es con Hand zu machen:
\~o=õ
oder wenn das "=" nciht geht, bzw. auch andere solche Zeichen nicht gehen:
\~o
õ
also mit newline, oder nach dem Schema Nummer=code und das 2 mal, einmal
für den BibTex-code und einmal für das Unicodezeichen.
Post by Jakob Lenfers· Beim Ausgeben der Strings Richtung Struts/Webbrowser muss es dann
auch UTF-8 sein. Aber das könnte dann ja mit getBytes("UTF-8") zu
lösen sein, oder?
nein, die machst dir einen Writer und sagst ihm er soll UTF-8 ausgeben.
Siehe die Javadoku dazu.
Grusstheo
--
Jochen Theodorou
Groovy Tech Lead