斑竹求救!关于转换

斑竹求救!关于转换

我下载了一个页面,不过用vi都是。。。。。。。。。
想用如下命令把标签去掉:
cat filename1 | sed 's/<.*>//g'>filename2
可是不行。请教      
html 文件格式太复杂, 不宜用 sed 处理.
如果你能保证每行里面的 < > 是成对的, 可以试试:
$ sed -e 's/<[^>]\+>//g' foo.html      
那斑竹假设要编辑一些html文件,怎么处理?      
我一开始用sed s/<.*>//g命令来清除标签,文件中间留下^M的标签。
但是我想用grep -v "^\^M"却没有办法消除,请教。