JavaScript 如何从字符串中去除HTML标签
为了从字符串中去除所有的HTML标签,JavaScript中有很多方法。为了去除标签,我们可以使用 replace()函数,还可以使用HTML DOM中的 .textContent属性 和 .innerText属性 ,HTML标签分为 开标签 和 闭标签 。
- 开标签: 以
<
开头,后跟HTML关键字,以>
结束。例如,<html>
,<br>
,<title>
是HTML开标签的一些示例。 - 闭标签: 以
</
结束。例如,</html>
,</title>
是HTML闭标签的示例。
以下示例演示了这两种方法:
示例1
通过使用 replace()函数 和 正则表达式 ,可以识别字符串中的HTML标签并去除它们。使用正则表达式是一种更好的方法,可以轻松找到HTML标签并删除它们。
程序: 在JavaScript中,以下代码可以去除字符串中的HTML标签。
function removeTags(str) {
if ((str===null) || (str===''))
return false;
else
str = str.toString();
// Regular expression to identify HTML tags in
// the input string. Replacing the identified
// HTML tag with a null string.
return str.replace( /(<([^>]+)>)/ig, '');
}
console.log(removeTags('<html>Welcome to GeeksforGeeks.</html>'));;
輸出:
Welcome to GeeksforGeeks.
示例2
.textContent 属性会返回指定节点及其所有后代的文本内容。.innerText 属性与 .textContent 属性做相同的事情。
程序: 在JavaScript中,以下代码会去除字符串中的HTML标签。
// HTML tags contain text
var html = "<p>A Computer Science "
+ "Portal for Geeks</p>";
var div = document.createElement("div");
div.innerHTML = html;
var text = div.textContent || div.innerText || "";
console.log(text)
输出:
A Computer Science Portal for Geeks