厲害了!竟然有工程師在GitHub上建了一個新華詞典數據庫

開源最前線(ID:OpenSourceTop) 猿妹 整編

整理自:https://github.com/pwxcoo/chinese-xinhua

今天,給大家推薦一個GitHub上的一個熱門項目——chinese-xinhua ,一個新華字典數據庫,截至今日,該項目已經獲得了 927個「star」以及 230個「fork」。可能是知道的太少了

這個數據庫收錄了包括14032條歇後語,16142個漢字,31648個成語。(GitHub項目地址:https://github.com/pwxcoo/chinese-xinhua)

該數據庫的所有數據都放在data/ 目錄,對性能沒需求的話,可以直接使用作者的新華字典 API 。下面,我們一起來詳細了解一下這個數據庫

項目結構

該數據庫的項目結構如下:

chinese-xinhua/|+-.vscode/|||+-launch.json<--VSCode配置文件|+-data/<--數據文件夾|||+-idiom.json<--成語|||+-word.json<--漢字|||+-xiehouyu.json<--歇後語|||+-ci.json<--詞語|||+-ci.csv<--詞語(csv版本)|+-scripts/<--腳本文件夾|||+-addAbbreviation.py<--給成語添加首字母縮寫的腳本|||+-chengyu.py<--下載成語腳本|||+-word.py<--下載漢字腳本|||+-xiehouyu.py<--下載歇後語腳本|||+-ci.py<--下載詞語腳本

數據庫介紹

成語

[{"derivation":"語出《法華經·法師功德品》下至阿鼻地獄。」","example":"但也有少數意志薄弱的……逐步上當,終至墮入~。★《上饒集中營·煉獄雜記》","explanation":"阿鼻梵語的譯音,意譯為無間」,即痛苦無有間斷之意。常用來比喻黑暗的社會和嚴酷的牢獄。又比喻無法擺脫的極其痛苦的境地。","pinyin":"ābídìyù","word":"阿鼻地獄","abbreviation":"abdy"},...]

詞語

[{"ci":"宸綸","explanation":"1.帝王的詔書﹑制令。"},...]

漢字

[{"word":"嗄","oldword":"嗄","strokes":"13","pinyin":"á","radicals":"口","explanation":"嗄〈嘆〉

同啊」。表示省悟或驚奇

嗄!難道這里是沒有地方官的麼?--宋·佚名《新編五代史平話》

嗄á嘆詞。在句首,〈表〉疑問或反問~,這是什麼?~,你想幹什麼?"嗄"另見shà㈠。

嗄shà

⒈聲音嘶啞~聲。

嗄a1.助詞。表示強調﹑肯定或辯解。2.助詞。方言。表示疑問或反詰。

嗄xià1.見"嗄飯"。2.見"嗄程"。","more":"嗄ga、a部首口部首筆畫03總筆畫13嗄2
shà
〈形〉
(1)
聲音嘶啞的[hoarse]
終日嚎而嗌不嗄。--《老子》
(2)
又如嗄啞,嗄嘶(嗓音嘶啞)
嗄
shà
〈嘆〉
(1)
什麼[what]--表示否定
我要丟個幹乾淨,看你嗄法把我治。--清·蒲松齡《聊齋俚曲集》
(2)
舊時仆役對主人、下級對上級的應諾聲[yes]
帶進來」。兩邊軍士應一聲嗄」,即將牛皋推至面前。--《說嶽全傳》
另見á
嗄1
á
〈嘆〉
同啊」(á)。表示省悟或驚奇[ah]
嗄!難道這里是沒有地方官的麼?--宋·佚名《新編五代史平話》
另見shà
嗄1
shà ㄕㄚ╝
嗓音嘶啞。
鄭碼janr,u55c4,gbke0c4
筆畫數13,部首口,筆順編號2511325111354
嗄2
á ㄚˊ
同啊2」。
鄭碼janr,u55c4,gbke0c4
筆畫數13,部首口,筆順編號2511325111354"},...]

API接口

GET、POST均可,返回數據格式為JSON。下面將以GET做示例

直接請求成語,則需要兩個參數:

● type=idiom 表示需要請求成語

● word=興高采烈 表示請求的成語

示例,如請求興高采烈的成語,返回結果如下:

當你請求的是成語時,返回的結果包括:成語的來源、成語的解釋、成語的拼音、用成語造的句子以及成語的首字母縮寫。

直接請求拼音首字母縮寫,需要兩個參數:

● type=idiom 表示需要請求成語

● word=xgcl 表示請求的成語拼音首字母縮寫

請求歇後語,同樣需要兩個參數

● type=xiehouyu 表示需要請求歇後語

● riddle=王婆 表示請求的歇後語的語面。可以模糊匹配

請求歇後語,結果會返回帶有你輸入的關鍵詞的所有歇後語。

請求漢字,需要兩個參數

● type=word 表示需要請求漢字

● word=吳 表示請求的漢

感興趣的可以到GitHub上看看,果然是最怕工程師有文化。


●編號3259,輸入編號直達本文

●輸入m獲取文章目錄

[do_widget id=yuzo_widget-4] [do_widget id=yuzo_widget-9] 流行