前景提要
HDC调试需求开发(15万预算),能者速来!>>>
一、用CMS系统的时候,直接粘贴文章会带有很多没有的垃圾标签或者属性,所以我需要把html中的所有标签属性全部去掉,除了img标签的alt和src属性保留。
自己写了个,感觉不到位: //这个地方不知道怎么写,过滤所有标签的属性,除img的src和alt $html=preg_replace("/<([a-zA-Z]+)[^>]*>/","<\\1>",$html);
这个会把全部的都换掉,但是img的我不能按照我想要的那样,求大神。
二、然后还有个就是table标签,比如: <table......属性一大堆> <tr...属性一大堆><td>1.</td><td><span>随便一些字</span></td></td> <tr...属性一大堆><td>2.</td><td><span>随便一些字</span></td></td> </table>
我想整理后得到这样: <p> 1.<span>随便一些字</span> 2.<span>随便一些字</span> </p>