中文繁简转换

1. https://segmentfault.com/a/1190000005089690

Open Chinese Convert(OpenCC)是一個中文簡繁轉換開源項目,提供高質量的簡繁轉換詞庫和可供調用的函數庫(libopencc)。還提供命令行簡繁轉換工具,人工校對工具,詞典生成程序,以及圖形用戶界面。

brew install opencc

将繁体转为简体的命令如下:

opencc -i wiki_zh.text -o wiki_zhs.text -c zht2zhs_config.json

那个json是什么鬼?OpenCC的配置文件,现在已支持json写法,如下:

{

  "name": "Traditional Chinese to Simplified Chinese",

  "segmentation": {

    "type": "mmseg",

    "dict": {

      "type": "ocd",

      "file": "TSPhrases.ocd"

    }

  },

  "conversion_chain": [{

    "dict": {

      "type": "group",

      "dicts": [{

        "type": "ocd",

        "file": "TSPhrases.ocd"

      }, {

        "type": "ocd",

        "file": "TSCharacters.ocd"

      }]

    }

  }]

}

 

2. https://www.cnblogs.com/tangxin-blog/p/5616415.html


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部