hallo miteinander,
ich plage mich seit geraumer seit mit einem thema das offensichtlich viel komplexer ist als es sich anhört...
es geht primär um das verstecken von informationen in klartext (also wirklich pures ASCII von 0 - 127 bit)
ausgehend von einem unbekanntem text T, muß ich eine markierung vornehmen und irgendwann auch mal
überprüfen ob T markiert wurde, also T = T'
meine constraints (die ich BEIDE erfüllen muss) sind die folgenden:
-------------------------------------------------------------------------
1.) ich darf den text von seiner semantischen ebene (also dem "sinn") her unter keinen umständen verändern...
was dank Natural Language Processing (kurz: NLP) Techniken irgendwie zu schaffen ist...
---> Beispiel:
Orginal, also T: "Das Haus, dass wir gesehen haben, war grün...hmm, oder doch blau?"
Markiert, also T' : "Das Haus, dass wir gesehen haben, war blau...hmm, oder doch grün?"
somit haben wir hier die semantik nicht verändert wohl aber die syntax...was uns zum
zweiten constraint führt...
2.) von der syntaktischen ebene her, darf ich tun und lassen was ich will...dies beinhaltet also z.b
das einfügen von nonprintable charachters wie die ersten: 0 - 32 bits sowie das 127 bit des ascii-
zeichensatzes (und ja ich bin an diesen gebunden, unicode kommt leider NICHT in frage...)
-------------------------------------------------------------------------
der 2.) constraint ist dahingehend eine herrausforderung, da wie wir alle wissen das kryptische
zeichen entstehen, wenn wir sonderzeichen irgendwo anhängen und damit der 1.) constraint zunichte
gemacht wird...das einizigste was den 1.) constraint nicht kapput machen würde, wäre das einfügen
von leerzeichen, jedoch aber auch nur am ende des textes. Das doofe dabei ist, hiermit lassen
sich keine bits unterscheiden ! angenommen wir haben folgenden text:
T = "jungs haben nur frauen, drogen und bla im kopf"
T' = "jungs haben nur drogen, frauen und bla im kopf"
somit wurde das 4 wort mit dem 5 wort vertauscht, diese positionen müsste ich logischerweise
irgendwo protokollieren und da liegt die problematik, ich habe nur leerzeichen zur verfügung :-(
hat irgendjemand ein denkanstoss für mich, wie ich die positionen unterbringen könnte ??
noch ein kleiner constraint ---> die protokollierung muß IM SELBEN file reingeschrieben werden...
wäre dankbar für jede idee...
ich plage mich seit geraumer seit mit einem thema das offensichtlich viel komplexer ist als es sich anhört...
es geht primär um das verstecken von informationen in klartext (also wirklich pures ASCII von 0 - 127 bit)
ausgehend von einem unbekanntem text T, muß ich eine markierung vornehmen und irgendwann auch mal
überprüfen ob T markiert wurde, also T = T'
meine constraints (die ich BEIDE erfüllen muss) sind die folgenden:
-------------------------------------------------------------------------
1.) ich darf den text von seiner semantischen ebene (also dem "sinn") her unter keinen umständen verändern...
was dank Natural Language Processing (kurz: NLP) Techniken irgendwie zu schaffen ist...
---> Beispiel:
Orginal, also T: "Das Haus, dass wir gesehen haben, war grün...hmm, oder doch blau?"
Markiert, also T' : "Das Haus, dass wir gesehen haben, war blau...hmm, oder doch grün?"
somit haben wir hier die semantik nicht verändert wohl aber die syntax...was uns zum
zweiten constraint führt...
2.) von der syntaktischen ebene her, darf ich tun und lassen was ich will...dies beinhaltet also z.b
das einfügen von nonprintable charachters wie die ersten: 0 - 32 bits sowie das 127 bit des ascii-
zeichensatzes (und ja ich bin an diesen gebunden, unicode kommt leider NICHT in frage...)
-------------------------------------------------------------------------
der 2.) constraint ist dahingehend eine herrausforderung, da wie wir alle wissen das kryptische
zeichen entstehen, wenn wir sonderzeichen irgendwo anhängen und damit der 1.) constraint zunichte
gemacht wird...das einizigste was den 1.) constraint nicht kapput machen würde, wäre das einfügen
von leerzeichen, jedoch aber auch nur am ende des textes. Das doofe dabei ist, hiermit lassen
sich keine bits unterscheiden ! angenommen wir haben folgenden text:
T = "jungs haben nur frauen, drogen und bla im kopf"
T' = "jungs haben nur drogen, frauen und bla im kopf"
somit wurde das 4 wort mit dem 5 wort vertauscht, diese positionen müsste ich logischerweise
irgendwo protokollieren und da liegt die problematik, ich habe nur leerzeichen zur verfügung :-(
hat irgendjemand ein denkanstoss für mich, wie ich die positionen unterbringen könnte ??
noch ein kleiner constraint ---> die protokollierung muß IM SELBEN file reingeschrieben werden...
wäre dankbar für jede idee...