中文詞性

1、詞性 參考北大的詞性標注

b 區別詞 取漢字「別」的聲母。
c 連詞 取英語連詞conjunction的第1個字母。
e 歎詞 取英語歎詞exclamation的第1個字母。
f 方位詞 取漢字「方」 的聲母。
g 語素 絕大多數語素都能作為合成詞的「詞根」,取漢字「根」的聲母。
h 前接成分 取英語head的第1個字母。
i 成語 取英語成語idiom的第1個字母。
j 簡稱略語 取漢字「簡」的聲母。
k 後接成分
l 習用語 習用語尚未成為成語,有點「臨時性」,取「臨」的聲母。
m 數詞 取英語numeral的第3個字母,n,u已有他用。
nr 人名 名詞代碼n和「人(ren)」的聲母並在一起。
o 擬聲詞 取英語擬聲詞onomatopoeia的第1個字母。
p 介詞 取英語介詞prepositional的第1個字母。
q 量詞 取英語quantity的第1個字母。
r 代詞 取英語代詞pronoun的第2個字母,因p已用於介詞。
s 處所詞 取英語space的第1個字母。
Tg 時語素 時間詞性語素。時間詞代碼為t,在語素的代碼g前面置以T。
t 時間詞 取英語time的第1個字母。
u 助詞 取英語助詞auxiliary 的第2個字母,因a已用於形容詞。
w 標點符號
x 非語素字 非語素字只是一個符號,字母x通常用於代表未知數、符號。
y 語氣詞 取漢字「語」的聲母。
z 狀態詞
Ng 名語素 名詞性語素。名詞代碼為n,語素代碼g前面置以N。
n 名詞 取英語名詞noun的第1個字母。
Vg 動語素 動詞性語素。動詞代碼為v。在語素的代碼g前面置以V。
v 動詞 取英語動詞verb的第一個字母。
vd 副動詞 直接作狀語的動詞。動詞和副詞的代碼並在一起。
vn 名動詞 指具有名詞功能的動詞。動詞和名詞的代碼並在一起。
Ag 形語素 形容詞性語素。形容詞代碼為a,語素代碼g前面置以A。
a 形容詞 取英語形容詞adjective的第1個字母。
ad 副形詞 直接作狀語的形容詞。形容詞代碼a和副詞代碼d並在一起。
an 名形詞 具有名詞功能的形容詞。形容詞代碼a和名詞代碼n並在一起。
Dg 副語素 副詞性語素。副詞代碼為d,語素代碼g前面置以D。
d 副詞 取adverb的第2個字母,因其第1個字母已用於形容詞。

有幾個改動:添加了口語詞性expr(參考知網),nr指人名,sn指姓氏–兩者分開是我的想法,fname指姓+名—-又加上這個是因為畢業設計時,使用的中科院的分詞只能分出姓+名的姓氏

詞的語義meta是指知網定義的詞的義項(由一個或多個義原組成)

2、數據庫中表的結構

::基礎詞詞彙的基礎,類似字典
詞性posl {ID,名稱,代碼,說明} 例:動詞、名詞……
感情詞性WordEmotion {ID,名稱} 例:褒義,中性,貶義

關於詞的語義:
例,對於「過去」這個詞有4層意思:
過去 ADJ aValue|屬性值,time|時間,past|昔
過去 V die|死
過去 V go|去
過去 N time|時間,past|昔(用英文逗號)
在動詞表中的meta可以這樣表示:die|死,go|去(用中文逗號)

Ng 名語素 名詞性語素。名詞代碼為n,語素代碼g前面置以N。
n 名詞 取英語名詞noun的第1個字母。
ns 地名 名詞代碼n和處所詞代碼s並在一起。
nt 機構團體 「團」的聲母為t,名詞代碼n和t並在一起。
nz 其他專名 「專」的聲母的第1個字母為z,名詞代碼n和z並在一起。
名詞noun {ID,名稱,出現次數}
名詞詞性NounPosl {ID,名詞ID,詞性代碼} 詞性代碼:{Ng,n}
名詞感情 NounEmotion {ID,名詞ID,EmotionID}
名詞語義NounMeta {ID,名詞ID,meta}
名詞同義詞NounSynonymy {ID,名詞ID,(同義詞)名詞ID}
名詞反義詞NounAntonymy {ID,名詞ID,(反義詞)名詞ID}

Vg 動語素 動詞性語素。動詞代碼為v。在語素的代碼g前面置以V。
v 動詞 取英語動詞verb的第一個字母。
vd 副動詞 直接作狀語的動詞。動詞和副詞的代碼並在一起。
vn 名動詞 指具有名詞功能的動詞。動詞和名詞的代碼並在一起。
動詞verb {ID,名稱,出現次數}
動詞詞性VerbPosl {ID,動詞ID,詞性代碼} 詞性代碼:{Vg,v,vd,vn}
動詞感情 VerbEmotion{ID,動詞ID,EmotionID}
動詞語義VerbMeta {ID,動詞ID,meta}
動詞同義詞VerbSynonymy {ID,動詞ID,(同義詞)動詞ID}
動詞反義詞VerbAntonymy {ID,動詞ID,(反義詞)動詞ID }

Ag 形語素 形容詞性語素。形容詞代碼為a,語素代碼g前面置以A。
a 形容詞 取英語形容詞adjective的第1個字母。
ad 副形詞 直接作狀語的形容詞。形容詞代碼a和副詞代碼d並在一起。
an 名形詞 具有名詞功能的形容詞。形容詞代碼a和名詞代碼n並在一起。
形容詞adjective {ID,名稱,出現次數}
形容詞詞性AdjectivePosl {ID,形容詞ID,詞性代碼} 詞性代碼:{Ag,a,ad,an}
形容詞感情 AdjectiveEmotion {ID,形容詞ID,EmotionID}
形容詞語義 AdjectiveMeta {ID,形容詞ID,meta}
形容詞同義詞AdjSynonymy {ID,形容詞ID,(同義詞)形容詞ID }
形容詞反義詞AdjAntonymy {ID,形容詞ID,(反義詞)形容詞ID }

Dg 副語素 副詞性語素。副詞代碼為d,語素代碼g前面置以D。
d 副詞 取adverb的第2個字母,因其第1個字母已用於形容詞。
副詞adverb {ID,名稱,出現次數}
副詞詞性AdverbPosl {ID,副詞ID,詞性代碼} 詞性代碼:{Dg,d}
副詞感情AdverbEmotion {ID,副詞ID,EmotionID}
副詞語義AdverbMeta {ID,副詞ID,meta}
副詞同義詞AdvSynonymy {ID,副詞ID,(同義詞)副詞ID }
副詞反義詞AdvAntonymy {ID,副詞ID,(反義詞)副詞ID }

常用詞搭配庫:
形+名AdjNoun {ID,形容詞ID,名詞ID,出現次數}
副+動AdvVerb {ID,副詞ID,動詞ID,出現次數}
副+形AdvAdj {ID,副詞ID,形容詞ID,出現次數}
姓氏surname {ID,名稱,出現次數}
人名name {ID,名稱,出現次數}
姓+名 PersonName {ID,名稱,出現次數} 之所以出現這張表,是因為畢業設計時,使用的中科院的分詞只能分出姓+名的姓氏

地名location {ID,NounLexiconID }
機構團體公司組織corp {ID,NounLexiconID} 如何確定屬於哪個國家,同地名

成語idiom {ID,名稱,出現次數} 原義/古義
成語感情IdiomEmotin {ID,成語ID,EmotionID}

諺語類別ProverbCategory {ID,類別}
::氣象 農業 衛生 為人處世 學習 體育鍛煉 等
諺語proverb {ID,句子,類別ID } 通常意思是確定的;格式(一句話):xxxxxx,xxxxxx.
諺語感情 {ID,諺語ID,EmotionID}
歇後語parol {ID,句子,意義,拼音} 通常意思是確定的;格式:xxxxxx—xx.主要意思是破折號後面的內容
歇後語詞性 {ID,歇後語ID,詞性ID}
歇後語感情 {ID,歇後語ID,EmotionID}
*歇後語的同義詞/反義詞可以通過視圖查詢來實現,查詢條件:意義(破折號後的內容)+詞性(+感情詞性)
::其它詞,除了上面的外的其它詞性
其它詞 Sword {ID,詞,出現次數}
其它詞詞性 SwordPosl {ID,SwordID,poslID}
其它詞語義 SwordMeta {ID,SwordPoslID,meta}

單字 SingleWord {id,字,nameFreq,surnameFreq},後兩個是:作為名字出現的次數和作為姓氏出現的次數

三國人物簡介

搞笑三國人物簡介

中文名:劉備
呢稱:大耳朵
身 高:150CM(五短身材)
體重:150斤(板凳身材)
口頭讒:相信我,沒錯的。
最自豪的事:耳朵可用來趕蚊子。
最恨的人:哪個 比我帥我恨哪個。
最糗的事:上錯廁所。

中文 名:關羽
英文名:美髯公(賣剃鬚刀的最怕這種人)
身高:1·80米(沒量過)
體重:178公斤(賣棗的肯定要比賣肉的瘦點)
最喜 歡的人:貂嬋(曹操為什麼把她送給大哥,早知道當初用不要赤兔馬要貂嬋 了)
最有後悔說過的一句話:「虎女焉能配犬子」(不罵是不是孫權就不殺 我 了?!)
最討厭的人:曹操(在華榮道為放這小子,差點沒被軍師砍了!)
最喜歡的場景:XX軍隊潰逃中……忽然當中一面大道旗,上書漢壽亭 侯中間一個 斗大的關字……

中文名:張飛
英文名:FAYE(王菲的FANS)
身高:1.81米(可能更高)
體重:180公斤(可能更重)
最喜歡的人:劉備 (怎麼罵都那麼聽話,有同性戀的傾向)
最有文采的一句話:「三姓家奴」(罵得太有水平了!)
最討厭的人:呂布(因為這小子沒少挨大哥的 罵!)
最喜歡的東西:酒……

中文名:趙雲
呢稱:子龍
身高:1.78米(標準身材)
體重:160斤(魔鬼身材)
口頭讒: 吾乃常山趙子龍!
最自豪的事:在當陽坡打群架。(一個人一把西瓜刀殺出一條街,利害!)
最恨的人:也是呂布(評什麼把演義裡最風花雪月的事加 在他身上?我比他帥多 了!)

中文 名:諸葛亮
英文名:Sleep Dragon(為什麼人們總是叫我臥龍,不是站龍呢)
身高:1·80米(白馬王子)
體重:70公斤(身 材標準)
最喜歡的人:周瑜(要不是有你,怎麼顯出我的智商之高呢?)
最有文采的文章:前後「出師表」(聽的劉禪想睡覺,只好發兵!還有害得後 世 子孫上語文課還多了一篇要背的文章)
最討厭的人:黃阿丑(要不是看你有那麼一點點小聰明,能幫助我成為天下第一 偶像,我早休了你了!堂堂丞相 夫人…$#%@~…唉!)

中文名:龐統
別名:鳳雛
身高:1·69米(三等傷殘人士)
體重:69公斤(要減肥了不然不成比例 了)
最喜歡的人:所有人(看誰都比自己美,愛誰是誰吧)
最自豪的事:來陽縣日審百案(其實這些案子都是我自己編出來討劉備開心 的!)
最討厭的人:諸葛亮(因為這小子我總是排第二!)
最喜歡的東西:諸葛亮的羽扇和鶴敞……(聽後人說那玩意在遊戲裡都算寶物 呢!!!)

中文名:黃忠
呢稱:老黃
身高:1.68米
體重:60公斤(千斤難買老來瘦)
最喜歡的人:嚴顏(這老頭我喜歡)
最討厭的人:諸葛亮(這個人老是用激將法,要知道我有高血壓、心臟病、糖尿 病等等,他到底懂不懂尊老?)
最喜歡的東西:夏侯淵的腦袋(我的養老 保險、住房基金、兒子出國留學費都指 望它了。)

中文名:許褚
暱稱:虎癡
身高:1.80米
體重:230公斤
最喜歡的人:曹操
最恨的人:典 韋(有他在,就得不到曹操的心)
最光容的一件事:裸衣戰馬超(在眾人面前展現了自己的優美曲線)

姓名:夏侯敦
呢稱:獨龍眼
身高:1.98米(喬丹)
體重:198斤{勻稱)
最喜 歡的人:曹操(他是我老大)
最恨的人:曹性(嗚,嗚,嗚,我的EYE)
最自豪的事:諸葛亮的處女作《博望坡》,我是第一反面角色。

中文名:典韋
呢稱:惡 來
身高:2.30 米
體重:250公斤
最喜歡的人:許褚(這個傢伙真的象頭豬一樣,我現在是曹營中智力   排名倒數第二了。)
最討 厭的人:曹操(他媽的,他泡馬子,倒把我命賠上了,唉——)
最喜歡的東西:雙鐵戟(可惜被胡車兒這小子偷掉當廢鐵賣了,當年我可是花了 十兩銀子買 來的啊!)

中文名:周瑜
暱稱:小魚兒
身高:1.78米
體重:70公斤
最喜歡的人:自己(我實在是太帥了)
最有文采的一句話:既生魚,何生糧。
最討厭的人:豬哥恐鳴(要不是他,……我)
最喜歡的東西:還是自己

MySQL加速

如果在啟動項裏面設置的話: 加上 –skip-name-resolve
如果在配製檔裏面 :在 [MySQLD] 下面添加 skip-name-resolve 然後保存重起,就可以了!!

打開/etc/my.cnf檔,修改以下設置,如果沒有,可手動添加。調整設置時,請量力而行,這與你的伺服器的配置有關,特別是記憶體大小。以下設置比較適合於1G記憶體的伺服器,但並不絕對。

#指定索引緩 沖區的大小,它決定索引處理的速度,尤其是索引讀的速度。通過檢查狀態值Key_read_requestsKey_reads,可以知道 key_buffer_size設置是否合理。比例key_reads /key_read_requests應該盡可能的低,至少是1:1001:1000更好(上述狀態值可以使用show status like’key_reads’獲得)。key_buffer_size只對MyISAM表起作用。即使你不使用MyISAM表,但是內部的臨時磁片表是 MyISAM表,也要使用該值。可以使用檢查狀態值created_tmp_disk_tables得知詳情。
key_buffer = 384M

#要求MySQL 有的連接數量。當主要MySQL線程在一個很短時間內得到非常多的連接請求,這就起作用,然後主線程花些時間(儘管很短)檢查連接並且啟動一個新線程。 back_log值指出在MySQL暫時停止回答新請求之前的短時間內多少個請求可以被存在堆疊中。只有如果期望在一個短時間內有很多連接,你需要增加 它,換句話說,這值對到來的TCP/IP連接的偵聽佇列的大小。你的作業系統在這個佇列大小上有它自己的限制。試圖設定back_log高於你的作業系統 的限制將是無效的。默認數值是50
back_log = 200

#一個包的最大尺寸。訊息緩衝區被初始化為 net_buffer_length位元組,但是可在需要時增加到max_allowed_packet個位元組。缺省地,該值太小必能捕捉大的(可能錯誤) 包。如果你正在使用大的BLOB列,你必須增加該值。它應該象你想要使用的最大BLOB的那麼大。
max_allowed_packet = 4M

#允許的同時客戶的數量。增加該值增加 mysqld要求的檔描述符的數量。這個數字應該增加,否則,你將經常看到 鏈結過多,請聯繫空間商 錯誤。 默認數值是100
max_connections = 1024

#指定表快取記憶體的大小。每當MySQL訪問一個表時,如果在表緩衝區中還有空間,該表就被打開並放入其中,這樣可以更快地訪問表內容。通過檢查峰值時間的狀態值Open_tablesOpened_tables,可以決定是否需要增加table_cache的值。如果你發現open_tables等於table_cache,並且opened_tables在不斷增長,那麼你就需要增加table_cache的值了(上述狀態值可以使用show status like ‘Open_tables’獲得)。注意,不能盲目地把table_cache設置成很大的值。如果設置得太高,可能會造成檔描述符不足,從而造成性能不穩定或者連接失敗。
table_cache = 512

#每個線程排序所需的緩衝
sort_buffer_size = 4M

#當一個查詢不斷地掃描某一個表,MySQL會為它分配一段記憶體緩衝區。read_buffer_size變數控制這一緩衝區的大小。如果你認為連續掃描進行得太慢,可以通過增加該變數值以及記憶體緩衝區大小提高其性能。
read_buffer_size = 4M

#加速排序操作後的讀數據,提高讀分類行的速度。如果正對遠遠大於可用記憶體的表執行GROUP BYORDER BY操作,應增加read_rnd_buffer_size的值以加速排序操作後面的行讀取。仍然不明白這個選項的用處……
read_rnd_buffer_size = 8M

#用於REPAIR TABLE。不明白這個選項的用處,百度上找到的設置方向也是五花八門,有128M64M32M等,折中選一個。
myisam_sort_buffer_size = 64M

#可以複用的保存在中的線程的數量。如果有,新的線程從緩存中取 得,當斷開連接的時候如果有空間,客戶的線置在緩存中。如果有很多新的線程,為了提高性能可以這個變數值。通過比較 Connections Threads_created狀態的變數,可以看到這個變數的作用。
thread_cache_size = 128

#查詢結果緩存。第一次執行某條SELECT語句的時候,伺服器記住該查詢的文本內容和它返回的結果。伺服器下一次碰到這個語句的時候,它不會再次執行該語句。作為代替,它直接從查詢緩存中的得到結果並把結果返回給用戶端。
query_cache_size = 32M

#最大併發線程數,cpu數量*2
thread_concurrency = 2

#設置超時時間,能避免長連接
wait_timeout = 120

#關閉不需要的表類型,如果你需要,就不要加上這個
skip-innodb
skip-bdb