2006年05月08日

テキストエディタ 秀丸で正規表現(覚え書き)

Word や Excel から Web 保存したファイルには、余分な html タグがたくさん含まれています。

html タグを削除したい場合、正規表現を使用することで置換作業が飛躍的に楽になります。

テキストエディタ「秀丸」では、置換するときに正規表現を使用することができます。

例1) Word から Web 保存したデータで、sup タグを一時的に別の記号で置き換えたい場合。

対象文例
石田<sup>1)</sup>

正規表現
検索:<sup>\f[^<]+\f</sup>
置換:\1

結果
石田1)


例2) Excel から Web 保存したデータから、ruby タグを削除したい場合。

対象文例
<ruby>石田<span  style='display:none'><rt>イシダ</rt></span></ruby>■■■■■<ruby>石田<span  style='display:none'><rt>イシダ</rt></span></ruby>

正規表現
検索:<ruby>[^<]+<span  style='display:none'><rt>[^<]+</rt></span></ruby>
置換:空欄

結果
■■■■■

以上、個人的覚え書きでした。

posted by ishida at 17:49 | 東京 ☔ | Comment(0) | TrackBack(0) | ユーティリティ系
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。