Question 1

什么算隐藏字符？

Accepted Answer

任何渲染时没有可见字形的 Unicode 字符。常见的有零宽空格（U+200B）、零宽连接符（U+200D）、零宽非连接符（U+200C）、从左到右和从右到左标记（U+200E、U+200F）、软连字符（U+00AD）。检测器按码点逐一标记。

Question 2

为什么我的文本里会出现隐藏字符？

Accepted Answer

三个常见来源。从网页或 PDF 复制会带入源里的不可见字符。编辑器或 CMS 插入它们用于换行控制。或者有人故意植入，为了水印、排版，或让标识符比较结果不同。

Question 3

隐藏字符危险吗？

Accepted Answer

本身不危险。但在代码、用户名和 URL 里，它们能改变文本的解析方式。Trojan Source 攻击（CVE-2021-42574）用双向覆盖字符让编译器读到的逻辑与评审者看到的不一样。在用户名里，隐藏的 U+200B 让两个看起来一模一样的字符串比较为不同。

Question 4

如何移除隐藏字符？

Accepted Answer

粘贴文本，点击分析，再点击移除隐藏字符。工具剥离它检测到的每一个不可见字符，保留可见文本。用复制干净文本把结果拿回去。

Question 5

我的文本会被发送到别处吗？

Accepted Answer

不会。检测器完全以 JavaScript 在你的浏览器里运行。不上传任何东西到服务器，所以用于源代码、凭据或任何不能分享的文本都是安全的。

Question 6

这个工具能检测同形字攻击吗？

Accepted Answer

不能。同形字是可见字符。西里尔字母 а（U+0430）看起来和拉丁字母 a（U+0061）一模一样，但两者都正常渲染。本工具标记的是不可见字符。检测易混淆字符需要对 Unicode 的 confusables 数据做比对，它把看起来相似的字符映射到一个归一化的骨架。

隐藏字符检测器

为什么不可见字符是个真实的问题