拼音切分

我之前贴了一个拼音列表,然后给出了一个Trie树的实现。也许能猜出来,对了,我要做一个拼音切词。通常url中的拼音是没有字符分割的比如说guojibaodao(国际报道)。如果我们想用一用url中的这部分信息,我们可以选择做一下切分,然后把它映射成汉字。

和上次一样,我贴出来代码。实现还是很一目了然的,就别废话了。这个实现只给出了一种可能的切分结果。如果需要返回所有的情况,需要自己修改一下。运行时需要一个pinyin_trie的文件。这个就自己生成吧。


#!/usr/bin/env pythonimport sys, pickleclass TrieNode(object):def __init__(self):self.value = Noneself.children = {}class Trie(object):def __init__(self):self.root = TrieNode()def add(self, key):node = self.rootfor char in key:if char not in node.children:child = TrieNode()node.children[char] = childnode = childelse:node = node.children[char]node.value = keydef search(self, key):node = self.rootmatches = []


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部