- 链接:https://leetcode.cn/problems/implement-trie-prefix-tree/description/
字典树 #
又称前缀树或字典树,是一棵有根树,其每个节点包含以下字段:
- 指向子节点的指针数组 $children$。对于本题而言,数组长度为 $26$,即小写英文字母的数量。此时 $children[0]$ 对应小写字母 $a$,$children[1]$ 对应小写字母 $b$,…,$children[25]$ 对应小写字母 $z$。
- 布尔字段 $isEnd$,表示该节点是否为字符串的结尾。
插入字符串 #
我们从字典树的根开始,插入字符串。对于当前字符对应的子节点,有两种情况:
- 子节点存在。沿着指针移动到子节点,继续处理下一个字符。
- 子节点不存在。创建一个新的子节点,记录在 $children$ 数组的对应位置上,然后沿着指针移动到子节点,继续搜索下一个字符。
重复以上步骤,直到处理字符串的最后一个字符,然后将当前节点标记为字符串的结尾。
查找前缀 #
我们从字典树的根开始,查找前缀。对于当前字符对应的子节点,有两种情况:
- 子节点存在。沿着指针移动到子节点,继续搜索下一个字符。
- 子节点不存在。说明字典树中不包含该前缀,返回空指针。
重复以上步骤,直到返回空指针或搜索完前缀的最后一个字符。
若搜索到了前缀的末尾,就说明字典树中存在该前缀。此外,若前缀末尾对应节点的 $isEnd$ 为真,则说明字典树中存在该字符串。
代码 #
class Trie {
//记录该字母的下一位所有可能的字母坐标
private Trie[] children;
//该字母是否为最后一个字母
private boolean isEnd;
public Trie() {
//初始化26个字母
children = new Trie[26];
//默认为不是最后一个字母
isEnd = false;
}
public void insert(String word) {
//得到字典树根节点
Trie node = this;
//去遍历待插入单词的字符集合
for (char c : word.toCharArray()) {
//得到该字符在数组中的坐标
int index = c - 'a';
//如果正在遍历的该字母在上一个节点的数组坐标中没有记录,就新建一个字母节点在字典树中
if(node.children[index] == null){
node.children[index] = new Trie();
}
//每一次生成字母都移动指针到下一个字母节点
node = node.children[index];
}
//最后一个字母节点设置为最后一个字母
node.isEnd = true;
}
public boolean search(String word) {
//返回检索到的最后一个字母节点
Trie node = searchPrefix(word);
//只有当该单词在字典树中存在并且最后一个字母节点为最后一个字母,才返回true
return node != null && node.isEnd;
}
public boolean startsWith(String prefix) {
//只要前缀匹配存在于字典树中就返回true
return searchPrefix(prefix) != null;
}
//前缀搜索 还是 全文搜索都是调用此方法,区别在于前缀搜索只要前缀匹配就返回true,全文搜索则要匹配到最后一个字母才返回true,所以这里返回的是最后一个字母节点
public Trie searchPrefix(String word){
//得到字典树根节点
Trie node = this;
//开始验证字符串在字典树中是否存在
for (char c : word.toCharArray()) {
//得到该字符在数组中的坐标
int index = c - 'a';
//如果该字符在数组中存在,就移动指针到下一个字母节点,直至到达最后一个待搜索的最后一个字母节点
if(node.children[index] != null){
node = node.children[index];
}else{
//如果在此过程中没有找到待搜索的其中一个字母节点,就返回null,代表该字母不存在于字典树中
return null;
}
}
//没有问题,那就是到达了最后一个待搜索的最后一个字母节点,返回该节点(节点可能是最后一个字母节点也可能不是)
return node;
}
}
/**
* Your Trie object will be instantiated and called as such:
* Trie obj = new Trie();
* obj.insert(word);
* boolean param_2 = obj.search(word);
* boolean param_3 = obj.startsWith(prefix);
*/
- 时间复杂度:初始化为 $O(1)$,其余操作为 $O(|S|)$,其中 $|S|$ 是每次插入或查询的字符串的长度。
- 空间复杂度:$O(|T|\cdot\Sigma)$,其中 $|T|$ 为所有插入字符串的长度之和,$\Sigma$ 为字符集的大小,本题 $\Sigma=26$。