HTML-Ascii Zeichen dekodieren

Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

  • HTML-Ascii Zeichen dekodieren

    Anzeige
    Hi,

    ich schreibe grade an einem kleinen Java Tool was mit über den Seitenquelltext einer Youtube Playlist Seite (Beispiel: *KLICK*) den Playlist-Namen sowie alle Videonamen und deren Links ausließt.
    Das Problem ist das Html-Ascii Zeichen im Seitenquelltext codiert sind. (Beispiel: Let & # 3 9 ; s Play Divinity: Original Sin, Leerzeichen sind dazu da zu verhindern das das Apostroph automatisch eingesetzt wird.)

    Kennt jemand eine gute Möglichkeit einen String zu durchsuchen und die entsprechenden Symbole zu ersetzen?
    Und weiß jemand ob das eventuell nur beim Apostroph erscheint. Ich habe andere Ascii Charaktere ausprobiert wie z.B. ↨ Und das war auch im Seitenquelltext nicht ersetzt.

    Dieser Beitrag wurde bereits 7 mal editiert, zuletzt von BloggingLP ()

  • UTF8-Symbole werden nicht kodiert, die anderen sind eigtl. nur der ASCii-Code, unter PHP gibts dafür ne Funktion, bei Java scheint man irgendwas vom Apache zu benötigen...

    stackoverflow.com/questions/99…ke-httputility-htmldecode
    ——YouTube————————————————————————————————————————————
    — Endlos-Projekte: Minecraft (SinglePlayer), Craft The World, Banished, Besiege, Sims4
    — ..Abgeschlossen: Leisure Suit Larry 6+7, Dishonored, Surface 2+3, Mirrors Edge, uvm
    — . Kurz- Projekte: The Tower, Fighting Is Magic, Euro Truck Simulator 2, uvm
    — ......Retro-Ecke: Day Of The Tentacle, Flight Of The Amazon Queen, NFS: HP2, uvm
    ————————————————————————————————————————————TbMzockt.de—
  • Char Verbleich ist absolut unsinnig, da Java dafür mehr als eine fertige Funktion bietet, um mit Strings zu arbeiten.

    Zum Problem: Entweder nimmt du was fertiges, die Apache Bibliotheken sind ja denke bekannt und auf GitHub findet sich immer was, oder du testest eben weiter und machst dir eine Liste, was es zu ersetzen gibt. (Ich würde die Bibliothek nutzen.)
  • DerET schrieb:

    Ich vermute mal stark des Leerzeichens wegen? Probiere es mal ohne. (Decodiert das der Browser richtig?)


    Das Lerzeichen habe ich eingefügt damit es nicht automatisch durch ein Apostroph ersetzt wird. Im ursprünglichen Sring ist da kein Leerzeichen.
    Das problem ist nur wenn ich das ganze in die URL Funktion einfüge wie es am Ende geplant ist. Dann ersetzt er es nicht mehr automatisch.

    Beispiel:
    Let's Play Divinity: Original Sin #11 - Die Weberin der Zeit [HD+/German]

    /EDIT:
    WUT? Jetzt hat er es doch ersetzt...
    Interessant. Mit einem mal gehts doch. Dann bräuchte ich sie ja gar net dekodieren.

    /EDIT2:
    Okay ich weiß jetzt warum er es vorher nicht ersetzt hat. Hatte mir nur die Vorschau anziegen lassen und da ersetzt er es noch nicht.
    Gut zu wissen. Dann hat sich das Thema eigentlich geklärt.

    Auch wenns für die Zukunft gut wäre zu wissen wie man die nun richtig dekodiert... :S