nasec blog

プログラミングやPCについての覚え書き
SEARCH
PROFILE
北陸で働くSIer。主にWEB系。
効率化と情報共有を常に模索中。。
音ゲーが好きです。
好奇心旺盛で興味のあるものは何でも飛びつきます!
RECOMMEND
CATEGORIES
ARCHIVES
RECENT COMMENT
  • mkdirで作成したディレクトリに作成と同時に移動する
    h41k4 (04/22)
  • とぅ
    h41k4 (04/22)
  • mkdirで作成したディレクトリに作成と同時に移動する
    totoro (03/30)
  • Xperiaでファイルのダウンロードに失敗する
    h41k4 (12/14)
  • Xperiaでファイルのダウンロードに失敗する
    きむら (12/14)
  • Xperiaでファイルのダウンロードに失敗する
    h41k4 (12/01)
  • Xperiaでファイルのダウンロードに失敗する
    きむら (12/01)
  • 指定したデバイス、パス、またはファイルにアクセスできません。適切なアクセス許可がない可能性があります。
    ゆう (03/16)
  • ネットマーブル(チョコマ)のパズル「ボタン」
    Yero (03/12)
RECENT TRACKBACK
  • 指定したデバイス、パス、またはファイルにアクセスできません。適切なアクセス許可がない可能性があります。
    プレサーチ (11/19)
ブログパーツ
フィードメーター - nasec blog
OTHERS
SPONSORED LINKS
みんなのブログポータル JUGEM
<< pukiwikiで表内(テーブル)の文字に色をつけるには | main | Pythonで500 Internal Server Errorをデバッグする方法 >>
スポンサーサイト

一定期間更新がないため広告を表示しています

| - | | - | - |
XMLで不正な文字列(>記号)を使用してもエラーにならない?!
 xml.dom.minidom.parse()を使用してXMLのパースを行っていましたが、
タグの要素内で不正と思われる記号を使用してもエラーが出ずハマってしまいました。

エラーになる例
<test>aaa&aaa</test>

エラーにならない例
<test>aaa>aaa</test>

&マークや<記号だと
xml.parsers.expat.ExpatError: not well-formed (invalid token):
と表示されるのに、>は表示されない・・。

属性の中で">"を記載した際はエラーになりました。

調べてみると下記のような原因だったようです。
http://www.xmlmaster.org/article/d01/c02/より
「>」は、そのまま要素の内容として判断されます。これは、要素の内容に「>」のみが出現しても、必ずペアとして記述される「<」また は「</」が出現していないため、文字の「>」として判断されるからです(開始タグや終了タグの終わりとして判断しない)。

パーサの動作を考えれば納得ですね><。難しいです。


| Python | 20:21 | comments(0) | trackbacks(0)
スポンサーサイト
| - | 20:21 | - | - |
コメント
コメントする









この記事のトラックバックURL
http://nasec.jugem.jp/trackback/76
トラックバック