From 92776e03022875969c77c3ef185a7d4b5657bb10 Mon Sep 17 00:00:00 2001 From: CentOS Sources Date: Tue, 5 Nov 2019 14:46:54 -0500 Subject: [PATCH] import libkkc-data-0.2.7-12.el8 --- .gitignore | 1 + .libkkc-data.metadata | 1 + SOURCES/libkkc-data-1720044-reiwa.patch | 715 ++++++++++++++++++++++++ SOURCES/libkkc-data-HEAD.patch | 128 +++++ SPECS/libkkc-data.spec | 88 +++ 5 files changed, 933 insertions(+) create mode 100644 .gitignore create mode 100644 .libkkc-data.metadata create mode 100644 SOURCES/libkkc-data-1720044-reiwa.patch create mode 100644 SOURCES/libkkc-data-HEAD.patch create mode 100644 SPECS/libkkc-data.spec diff --git a/.gitignore b/.gitignore new file mode 100644 index 0000000..8be7a7b --- /dev/null +++ b/.gitignore @@ -0,0 +1 @@ +SOURCES/libkkc-data-0.2.7.tar.xz diff --git a/.libkkc-data.metadata b/.libkkc-data.metadata new file mode 100644 index 0000000..df3ddfd --- /dev/null +++ b/.libkkc-data.metadata @@ -0,0 +1 @@ +6e5d833744f8311908f12168dcf697633efc2795 SOURCES/libkkc-data-0.2.7.tar.xz diff --git a/SOURCES/libkkc-data-1720044-reiwa.patch b/SOURCES/libkkc-data-1720044-reiwa.patch new file mode 100644 index 0000000..d3431f6 --- /dev/null +++ b/SOURCES/libkkc-data-1720044-reiwa.patch @@ -0,0 +1,715 @@ +--- libkkc-data-0.2.7/data/models/text3/data.arpa.orig 2013-07-29 09:53:44.000000000 +0900 ++++ libkkc-data-0.2.7/data/models/text3/data.arpa 2019-06-14 19:40:12.243954762 +0900 +@@ -113032,6 +113032,8 @@ ngram 3=1777469 + -5.793264 れいる/レイル -0.118066 + -5.793264 れいれんぽう/嶺連峰 -0.118066 + -5.793264 れいれーだー/レイレーダー -0.118066 ++-4.144828 れいわ/令和 -0.424945 ++-5.793264 れいわし/令和史 -0.118066 + -4.957430 れいん/レイン -0.200946 + -5.793264 れいん/レ印 -0.118066 + -5.145029 れいんぼー/レインボー -0.154591 +@@ -144907,6 +144909,7 @@ ngram 3=1777469 + -5.098032 れいや/礼弥 -0.072304 + -5.044164 れいりょう/冷涼 -0.072304 + -4.972710 れいりょく/霊力 -0.236942 ++-4.392173 れいわ/令和 -0.313940 + -4.940956 れいんぼー/レインボー -0.072304 + -5.069764 れいヴ/レイヴ -0.072304 + -5.098032 れう/レウ -0.072304 +@@ -146556,6 +146559,7 @@ ngram 3=1777469 + -2.982255 ”/“ りか/リカ -0.072304 + -2.984747 ”/“ りっぷす/リップス -0.072304 + -2.984747 ”/“ りゅどべっく/リュドベック -0.072304 ++-2.401531 ”/“ れいわ/令和 -0.072304 + -2.967813 ”/“ ろしあ/ロシア -0.072304 + -2.984747 ”/“ ろろ/ロロ -0.072304 + -2.978004 ”/“ ろんぐ/ロング -0.072304 +@@ -179284,6 +179288,7 @@ ngram 3=1777469 + -5.474002 、/、 れいゆう/霊友 -0.072304 + -5.513696 、/、 れいら/澪ら -0.072304 + -5.474002 、/、 れいらく/零落 -0.072304 ++-3.626458 、/、 れいわ/令和 -0.214269 + -5.201475 、/、 れいん/レイン -0.072304 + -5.304164 、/、 れいんぼー/レインボー -0.072304 + -5.474002 、/、 れいヴ/レイヴ -0.072304 +@@ -193052,6 +193057,7 @@ ngram 3=1777469 + -4.874282 「/「 れいぷれい/レイプレイ -0.072304 + -4.802581 「/「 れいめい/黎明 -0.072304 + -4.858884 「/「 れいらく/零落 -0.072304 ++-3.563377 「/「 れいわ/令和 -0.072304 + -4.270722 「/「 れいん/レイン -0.072304 + -4.288723 「/「 れいんぼー/レインボー -0.174867 + -4.712579 「/「 れお/レオ -0.072304 +@@ -194481,6 +194487,7 @@ ngram 3=1777469 + -4.779356 」/」 るびー/ルビー -0.072304 + -4.801566 」/」 るーにー/ルーニー -0.072304 + -4.801566 」/」 れいき/霊亀 -0.072304 ++-4.716716 」/」 れいわ/令和 -0.072304 + -4.753206 」/」 れっど/レッド -0.072304 + -4.797707 」/」 れつでん/列伝 -0.072304 + -4.148340 」/」 れべる/レベル -0.072304 +@@ -284130,6 +284137,7 @@ ngram 3=1777469 + -4.663808 から/から れいさい/零細 -0.072304 + -4.654098 から/から れいすい/冷水 -0.072304 + -4.687050 から/から れいほん/零本 -0.072304 ++-4.016318 から/から れいわ/令和 -0.072304 + -3.924932 から/から れきし/歴史 -0.072304 + -3.486731 から/から れぎゅらー/レギュラー -0.120565 + -4.321704 から/から れこーど/レコード -0.072304 +@@ -303384,6 +303392,7 @@ ngram 3=1777469 + -5.074968 が/が れいぼう/冷房 -0.072304 + -5.183461 が/が れいめい/黎明 -0.072304 + -5.226618 が/が れいりー/レイリー -0.072304 ++-4.488603 が/が れいわ/令和 -0.072304 + -5.163391 が/が れいんぼー/レインボー -0.072304 + -5.257272 が/が れかい/レカイ -0.072304 + -5.163391 が/が れき/礫 -0.072304 +@@ -304886,6 +304895,7 @@ ngram 3=1777469 + -1.964672 がいよう/概要 へいせい/平成 -0.072304 + -1.858453 がいよう/概要 や/や -0.072304 + -1.965177 がいよう/概要 らん/欄 -0.072304 ++-1.964672 がいよう/概要 れいわ/令和 -0.072304 + -0.751328 がいよう/概要 を/を -0.072304 + -1.822462 がいよう/概要 )/) -0.072304 + -0.602046 がいようせつ/概要節 で/で -0.072304 +@@ -309841,6 +309851,7 @@ ngram 3=1777469 + -3.690753 き/き るい/ルイ -0.072304 + -3.498056 き/き れ/れ -0.072304 + -3.701199 き/き れい/零 -0.072304 ++-3.662051 き/き れいわ/令和 -0.072304 + -3.606577 き/き れっしゃ/列車 -0.072304 + -3.686900 き/き れぽーと/レポート -0.072304 + -3.117674 き/き ろーま/ローマ -0.072304 +@@ -326202,6 +326213,7 @@ ngram 3=1777469 + -2.370931 きんねん/近年 より/より -0.072304 + -2.448658 きんねん/近年 らくろす/ラクロス -0.072304 + -2.448093 きんねん/近年 りにゅーある/リニューアル -0.072304 ++-2.446084 きんねん/近年 れいわ/令和 -0.072304 + -2.093394 きんねん/近年 (/( -0.072304 + -1.099908 きんのう/勤王 せいさく/政策 -0.072304 + -1.099661 きんのう/勤王 とう/党 -0.072304 +@@ -326960,6 +326972,7 @@ ngram 3=1777469 + -2.933797 ぎかい/議会 ぼうえい/防衛 -0.072304 + -2.603043 ぎかい/議会 も/も -0.072304 + -2.586084 ぎかい/議会 や/や -0.072304 ++-2.940518 ぎかい/議会 れいわ/令和 -0.146868 + -1.489269 ぎかい/議会 を/を -0.072304 + -1.708817 ぎかい/議会 (/( -0.113334 + -2.498957 ぎかい/議会 )/) -0.072304 +@@ -332104,6 +332117,7 @@ ngram 3=1777469 + -3.732900 く/く れいせい/冷静 -0.072304 + -4.244735 く/く れいぞう/冷蔵 -0.072304 + -4.210069 く/く れいはい/礼拝 -0.072304 ++-4.159045 く/く れいわ/令和 -0.072304 + -3.653226 く/く れきし/歴史 -0.072304 + -4.159045 く/く れぎゅらー/レギュラー -0.072304 + -4.007426 く/く れっしゃ/列車 -0.072304 +@@ -333620,6 +333634,7 @@ ngram 3=1777469 + -3.477315 くうはく/  れいぎ/礼儀 -0.072304 + -3.480483 くうはく/  れいて/レイテ -0.072304 + -3.459790 くうはく/  れいはい/礼拝 -0.072304 ++-2.642860 くうはく/  れいわ/令和 -0.146868 + -3.488293 くうはく/  れんば/レンバ -0.072304 + -3.423929 くうはく/  ろしあ/ロシア -0.072304 + -3.483673 くうはく/  わか/分 -0.072304 +@@ -382948,6 +382963,7 @@ ngram 3=1777469 + -1.024375 さいはん/再版 は/は -0.072304 + -0.593435 さいはん/再犯 を/を -0.072304 + -0.623280 さいはん/最判 へいせい/平成 -0.072304 ++-0.623280 さいはん/最判 れいわ/令和 -0.072304 + -0.623350 さいば/サイバ とろん/トロン -0.072304 + -0.623226 さいば/西馬 おん/音 -0.072304 + -1.990008 さいばい/栽培 、/、 -0.072304 +@@ -389712,6 +389728,7 @@ ngram 3=1777469 + -3.437459 さらに/さらに るーつ/ルーツ -0.072304 + -3.365297 さらに/さらに るーと/ルート -0.072304 + -3.421405 さらに/さらに れいぞう/冷蔵 -0.072304 ++-3.399881 さらに/さらに れいわ/令和 -0.072304 + -3.440742 さらに/さらに れヴぁーむ/レヴァーム -0.072304 + -3.442178 さらに/さらに ろくぶくろ/六袋 -0.072304 + -3.402891 さらに/さらに ろけっと/ロケット -0.072304 +@@ -396222,6 +396239,7 @@ ngram 3=1777469 + -4.708864 し/し るーかす/ルーカス -0.072304 + -4.696211 し/し るーぷ/ループ -0.072304 + -4.134352 し/し れい/礼 -0.072304 ++-4.611507 し/し れいわ/令和 -0.072304 + -4.674918 し/し れおん/レオン -0.072304 + -4.611507 し/し れぎゅらー/レギュラー -0.072304 + -4.663204 し/し れこーでぃんぐ/レコーディング -0.072304 +@@ -404543,6 +404561,7 @@ ngram 3=1777469 + -2.818904 してい/指定 よきん/預金 -0.072304 + -2.678691 してい/指定 より/より -0.072304 + -2.819696 してい/指定 りゅうろ/流路 -0.072304 ++-2.239647 してい/指定 れいわ/令和 -0.072304 + -1.486136 してい/指定 を/を -0.431651 + -2.152732 してい/指定 ・/・ -0.072304 + -2.277143 してい/指定 (/( -0.072304 +@@ -416169,6 +416188,7 @@ ngram 3=1777469 + -2.939683 しょ/所 りじ/理事 -0.304917 + -3.504375 しょ/所 れい/令 -0.072304 + -3.526034 しょ/所 れいじょう/霊場 -0.072304 ++-3.509690 しょ/所 れいわ/令和 -0.072304 + -3.518694 しょ/所 れぽーと/レポート -0.072304 + -3.528030 しょ/所 ろんしゅう/論集 -0.072304 + -1.223515 しょ/所 を/を -0.201699 +@@ -416253,6 +416273,7 @@ ngram 3=1777469 + -3.173113 しょ/書 よん/四 -0.072304 + -3.194419 しょ/書 らん/欄 -0.072304 + -3.190975 しょ/書 りん/林 -0.072304 ++-3.190975 しょ/書 れいわ/令和 -0.072304 + -3.174502 しょ/書 れべる/レベル -0.072304 + -3.184880 しょ/書 ろく/六 -0.072304 + -0.839687 しょ/書 を/を -0.222420 +@@ -493028,6 +493049,7 @@ ngram 3=1777469 + -4.850080 た/た れいふ/レイフ -0.072304 + -4.850080 た/た れいふぉーる/レイフォール -0.072304 + -4.837677 た/た れいむ/霊夢 -0.072304 ++-4.116720 た/た れいわ/令和 -0.072304 + -4.250950 た/た れいん/レイン -0.072304 + -4.715868 た/た れお/レオ -0.236942 + -4.715868 た/た れおなるど/レオナルド -0.072304 +@@ -510831,6 +510853,7 @@ ngram 3=1777469 + -3.320679 だいがく/大学 りん/林 -0.072304 + -3.871892 だいがく/大学 りんじ/臨時 -0.072304 + -3.303866 だいがく/大学 りーぐ/リーグ -0.174867 ++-3.873638 だいがく/大学 れいわ/令和 -0.072304 + -3.835151 だいがく/大学 れきし/歴史 -0.072304 + -3.325109 だいがく/大学 れきだい/歴代 -0.072304 + -3.902577 だいがく/大学 れでぃ/レディ -0.072304 +@@ -541838,6 +541861,7 @@ ngram 3=1777469 + -4.734083 て/て れいてつ/冷徹 -0.236942 + -4.839375 て/て れいでぃあんと/レイディアント -0.072304 + -4.499282 て/て れいはい/礼拝 -0.072304 ++-3.917384 て/て れいわ/令和 -0.236942 + -4.764805 て/て れおぽるど/レオポルド -0.072304 + -4.595579 て/て れおん/レオン -0.072304 + -3.969517 て/て れきし/歴史 -0.146868 +@@ -543040,6 +543064,7 @@ ngram 3=1777469 + -1.041469 ていきょう/帝京 だい/大 -0.072304 + -0.576441 ていきょう/帝京 だいがく/大学 -0.130896 + -1.622860 ていきょう/帝京 へいせい/平成 -0.072304 ++-1.622860 ていきょう/帝京 れいわ/令和 -0.072304 + -1.518157 ていきょう/帝京 ・/・ -0.072304 + -1.391371 ていきょう/提供 -0.921243 + -1.825565 ていきょう/提供 、/、 -0.072304 +@@ -571695,6 +571720,7 @@ ngram 3=1777469 + -5.125194 と/と れいどう/礼堂 -0.072304 + -4.795774 と/と れいはい/礼拝 -0.072304 + -5.125194 と/と れいめん/冷麺 -0.072304 ++-4.697781 と/と れいわ/令和 -0.072304 + -5.125194 と/と れおのふ/レオノフ -0.072304 + -3.973298 と/と れきし/歴史 -0.072304 + -4.840256 と/と れきだい/歴代 -0.072304 +@@ -576725,6 +576751,7 @@ ngram 3=1777469 + -1.482731 とうべん/答弁 に/に -0.072304 + -1.768609 とうべん/答弁 へいせい/平成 -0.072304 + -1.682559 とうべん/答弁 や/や -0.072304 ++-1.768609 とうべん/答弁 れいわ/令和 -0.072304 + -1.102516 とうべん/答弁 を/を -0.072304 + -0.598217 とうほ/刀保 と/と -0.072304 + -0.860182 とうほ/頭堡 に/に -0.072304 +@@ -577333,6 +577360,7 @@ ngram 3=1777469 + -2.806740 とうろく/登録 よう/用 -0.072304 + -2.741191 とうろく/登録 より/より -0.072304 + -2.873185 とうろく/登録 りょう/料 -0.236942 ++-2.876906 とうろく/登録 れいわ/令和 -0.072304 + -1.001313 とうろく/登録 を/を -0.440906 + -2.798862 とうろく/登録 4/4 -0.072304 + -0.622515 とうろく/藤六 かい/会 -0.072304 +@@ -596049,6 +596077,7 @@ ngram 3=1777469 + -4.579494 な/な れいぼう/冷房 -0.072304 + -4.628120 な/な れいりょく/霊力 -0.072304 + -4.645619 な/な れいりー/レイリー -0.072304 ++-4.389925 な/な れいわ/令和 -0.072304 + -3.194401 な/な れきし/歴史 -0.137922 + -4.657425 な/な れきせいずみ/歴青炭 -0.072304 + -4.065382 な/な れくりえーしょん/レクリエーション -0.072304 +@@ -621348,6 +621377,7 @@ ngram 3=1777469 + -5.240575 に/に れいぼう/冷房 -0.072304 + -5.378036 に/に れいりょく/霊力 -0.072304 + -5.435587 に/に れいりー/レイリー -0.072304 ++-4.860039 に/に れいわ/令和 -0.072304 + -5.477705 に/に れいヴぇる/レイヴェル -0.072304 + -4.890008 に/に れおぽるど/レオポルド -0.174867 + -4.788866 に/に れおん/レオン -0.072304 +@@ -627382,6 +627412,7 @@ ngram 3=1777469 + -2.657697 にん/人 ら/ら -0.072304 + -3.660473 にん/人 りょく/力 -0.072304 + -3.743491 にん/人 りーち/リーチ -0.072304 ++-3.736065 にん/人 れいわ/令和 -0.072304 + -3.748333 にん/人 れおん/レオン -0.072304 + -3.754873 にん/人 れんこう/連行 -0.072304 + -3.718542 にん/人 れんぞく/連続 -0.072304 +@@ -657526,6 +657557,8 @@ ngram 3=1777469 + -5.595215 の/の れいら/レイラ -0.072304 + -5.565410 の/の れいりあ/レイリア -0.072304 + -5.483622 の/の れいりょく/霊力 -0.072304 ++-4.227805 の/の れいわ/令和 -0.158647 ++-5.628477 の/の れいわし/令和史 -0.072304 + -5.355448 の/の れいん/レイン -0.072304 + -5.447862 の/の れいんぼー/レインボー -0.072304 + -5.628477 の/の れいんぼーのん/レインボーノン -0.072304 +@@ -680802,6 +680835,7 @@ ngram 3=1777469 + -5.327788 は/は れいら/レイラ -0.072304 + -5.304503 は/は れいりあ/レイリア -0.072304 + -5.238888 は/は れいりょく/霊力 -0.072304 ++-3.715566 は/は れいわ/令和 -0.093914 + -5.131526 は/は れいん/レイン -0.072304 + -5.209459 は/は れいんぼー/レインボー -0.072304 + -5.108373 は/は れお/レオ -0.236942 +@@ -698659,6 +698693,7 @@ ngram 3=1777469 + -2.824848 ばんど/バンド やく/約 -0.072304 + -2.833662 ばんど/バンド ゆいいつ/唯一 -0.072304 + -2.838512 ばんど/バンド らいにち/来日 -0.072304 ++-2.835645 ばんど/バンド れいわ/令和 -0.072304 + -0.898614 ばんど/バンド を/を -0.233035 + -1.415625 ばんど/バンド ・/・ -0.113334 + -2.367244 ばんど/バンド (/( -0.072304 +@@ -782377,6 +782416,7 @@ ngram 3=1777469 + -4.593278 も/も れいぞう/冷蔵 -0.072304 + -4.749871 も/も れいねん/例年 -0.072304 + -4.774104 も/も れいりょう/冷涼 -0.072304 ++-4.100094 も/も れいわ/令和 -0.072304 + -4.610030 も/も れおん/レオン -0.072304 + -4.749871 も/も れきし/れきし -0.072304 + -3.550992 も/も れきし/歴史 -0.072304 +@@ -808658,6 +808698,7 @@ ngram 3=1777469 + -3.949347 より/より るーぷ/ループ -0.072304 + -3.955998 より/より れある/レアル -0.072304 + -3.967314 より/より れいしき/零式 -0.072304 ++-3.887906 より/より れいわ/令和 -0.072304 + -3.807900 より/より れきし/歴史 -0.072304 + -3.739008 より/より れべる/レベル -0.072304 + -3.739008 より/より れんごう/連合 -0.072304 +@@ -815224,6 +815265,7 @@ ngram 3=1777469 + -3.935261 り/り るーと/ルート -0.072304 + -4.192419 り/り れいかん/零観 -0.072304 + -4.107856 り/り れいがい/例外 -0.072304 ++-4.038086 り/り れいわ/令和 -0.072304 + -4.181950 り/り れきほう/歴訪 -0.072304 + -4.038086 り/り れぎゅらー/レギュラー -0.072304 + -3.992251 り/り れこーど/レコード -0.072304 +@@ -829929,6 +829971,7 @@ ngram 3=1777469 + -4.878610 る/る れいど/レイド -0.072304 + -4.825490 る/る れいぶん/例文 -0.072304 + -4.878610 る/る れいむ/霊夢 -0.072304 ++-3.979033 る/る れいわ/令和 -0.146868 + -4.786122 る/る れいん/レイン -0.072304 + -4.878610 る/る れおみゅーる/レオミュール -0.072304 + -4.675914 る/る れおん/レオン -0.072304 +@@ -832784,6 +832827,61 @@ ngram 3=1777469 + -0.623351 れいる/レイル うぇいず/ウェイズ -0.072304 + -0.577210 れいれんぽう/嶺連峰 の/の -0.072304 + -0.577210 れいれーだー/レイレーダー の/の -0.072304 ++-2.227588 れいわ/令和 」/」 -0.072304 ++-2.797031 れいわ/令和 いこう/以降 -0.072304 ++-2.815492 れいわ/令和 いご/以後 -0.072304 ++-2.822011 れいわ/令和 いしん/維新 -0.072304 ++-2.813706 れいわ/令和 うまれ/生まれ -0.072304 ++-2.810837 れいわ/令和 おんな/女 -0.072304 ++-2.763406 れいわ/令和 かい/会 -0.072304 ++-2.820059 れいわ/令和 かめん/仮面 -0.072304 ++-1.981531 れいわ/令和 がんねん/元年 -0.669840 ++-2.794269 れいわ/令和 き/期 -0.072304 ++-2.779196 れいわ/令和 くうはく/  -0.072304 ++-2.773161 れいわ/令和 けんきゅう/研究 -0.072304 ++-2.237433 れいわ/令和 こくさい/国際 -0.236942 ++-2.812611 れいわ/令和 しょき/初期 -0.072304 ++-2.773410 れいわ/令和 じだい/時代 -0.072304 ++-2.804348 れいわ/令和 じゅう/十 -0.072304 ++-2.749350 れいわ/令和 だいがく/大学 -0.072304 ++-2.811109 れいわ/令和 なん/何 -0.072304 ++-1.705106 れいわ/令和 に/に -0.174867 ++-2.820059 れいわ/令和 にじゅう/二十 -0.072304 ++-2.665933 れいわ/令和 ねん/年 -0.072304 ++-1.312593 れいわ/令和 の/の -0.260451 ++-2.812201 れいわ/令和 ばし/橋 -0.072304 ++-2.234353 れいわ/令和 ばん/版 -0.072304 ++-2.811791 れいわ/令和 ひゃく/百 -0.072304 ++-2.822150 れいわ/令和 ふきょう/不況 -0.072304 ++-2.603186 れいわ/令和 へ/へ -0.072304 ++-2.005596 れいわ/令和 を/を -0.072304 ++-1.636318 れいわ/令和 10/10 -1.006895 ++-1.981269 れいわ/令和 11/11 -1.026201 ++-1.980986 れいわ/令和 12/12 -0.743654 ++-1.982076 れいわ/令和 13/13 -0.965503 ++-1.776817 れいわ/令和 14/14 -0.876232 ++-1.776717 れいわ/令和 15/15 -0.752075 ++-1.638172 れいわ/令和 16/16 -1.311214 ++-1.317435 れいわ/令和 17/17 -0.858503 ++-1.317369 れいわ/令和 18/18 -0.965503 ++-1.533521 れいわ/令和 19/19 -1.147022 ++-1.963567 れいわ/令和 2/2 -0.861219 ++-1.532903 れいわ/令和 20/20 -1.169885 ++-1.448971 れいわ/令和 21/21 -1.243245 ++-1.449095 れいわ/令和 22/22 -1.169885 ++-1.777523 れいわ/令和 23/23 -1.241578 ++-1.378275 れいわ/令和 24/24 -1.097334 ++-2.812064 れいわ/令和 25/25 -0.174867 ++-2.241893 れいわ/令和 26/26 -0.072304 ++-1.768103 れいわ/令和 3/3 -0.943226 ++-2.819364 れいわ/令和 39/39 -0.072304 ++-1.972585 れいわ/令和 4/4 -0.743654 ++-1.530440 れいわ/令和 5/5 -0.906977 ++-1.773443 れいわ/令和 6/6 -0.840564 ++-1.977674 れいわ/令和 7/7 -1.158604 ++-1.977674 れいわ/令和 8/8 -0.894922 ++-1.978675 れいわ/令和 9/9 -0.705865 ++-0.611288 れいわし/令和史 (/( -0.072304 + -1.589717 れいん/レイン 」/」 -0.072304 + -1.156480 れいん/レイン こーと/コート -0.072304 + -1.736325 れいん/レイン だんす/ダンス -0.072304 +@@ -865668,6 +865766,7 @@ ngram 3=1777469 + -4.305606 ・/・ れいぷ/レイプ -0.072304 + -4.860306 ・/・ れいりあ/レイリア -0.072304 + -4.891397 ・/・ れいる/レイル -0.072304 ++-3.787640 ・/・ れいわ/令和 -0.072304 + -3.857118 ・/・ れいん/レイン -0.146868 + -4.723359 ・/・ れお/レオ -0.072304 + -4.723359 ・/・ れおなるど/レオナルド -0.072304 +@@ -866528,6 +866627,7 @@ ngram 3=1777469 + -3.119069 ・// るてん/流転 -0.072304 + -3.118594 ・// るねっさんす/ルネッサンス -0.072304 + -3.118120 ・// れいえん/霊園 -0.072304 ++-3.100918 ・// れいわ/令和 -0.072304 + -3.115755 ・// ろう/ろう -0.072304 + -3.119690 ・// ろーぷ/ろーぷ -0.072304 + -3.107810 ・// ろーぷ/ロープ -0.072304 +@@ -876442,6 +876542,7 @@ ngram 3=1777469 + -4.752700 (/( れいだい/例題 -0.072304 + -4.791409 (/( れいひょう/零票 -0.072304 + -4.721693 (/( れいふく/礼服 -0.072304 ++-2.774423 (/( れいわ/令和 -1.133625 + -4.791409 (/( れおなーる/レオナール -0.072304 + -4.791409 (/( れおのーる/レオノール -0.072304 + -3.936686 (/( れきし/歴史 -0.072304 +@@ -879044,6 +879145,7 @@ ngram 3=1777469 + -4.531804 )/) るーる/ルール -0.072304 + -4.663731 )/) れいど/レイド -0.072304 + -4.654904 )/) れいのるず/レイノルズ -0.072304 ++-4.547025 )/) れいわ/令和 -0.072304 + -4.573641 )/) れき/歴 -0.072304 + -4.665981 )/) れみ/れみ -0.072304 + -4.060401 )/) れんあい/恋愛 -0.072304 +@@ -891991,6 +892093,7 @@ ngram 3=1777469 + -3.643609 :/: りー/リー -0.072304 + -3.675989 :/: るいすとん/ルイストン -0.072304 + -3.607371 :/: るーる/ルール -0.072304 ++-3.615797 :/: れいわ/令和 -0.072304 + -3.642100 :/: れっど/レッド -0.072304 + -3.677072 :/: れてぃ/レティ -0.072304 + -3.628749 :/: れーざー/レーザー -0.072304 +@@ -920322,6 +920425,7 @@ ngram 3=1777469 + -5.505719 れいや/礼弥 + -5.473107 れいりょう/冷涼 + -5.023787 れいりょく/霊力 ++-3.418313 れいわ/令和 + -5.406274 れいんぼー/レインボー + -5.046992 れいヴ/レイヴ + -5.505719 れう/レウ +@@ -924021,6 +924125,7 @@ ngram 3=1777469 + -4.172010 「/「 れいげん/霊験 + -4.179672 「/「 れいぞう/れいぞう + -4.036689 「/「 れいちぇる/レイチェル ++-3.298122 「/「 れいわ/令和 + -4.024787 「/「 れいん/レイン + -4.125192 「/「 れおん/レオン + -3.692389 「/「 れきだい/歴代 +@@ -969223,6 +969328,7 @@ ngram 3=1777469 + -1.008358 ばんど/バンド めい/名 + -1.963870 ばんど/バンド めんばー/メンバー + -2.214397 ばんど/バンド ゆいいつ/唯一 ++-2.214661 ばんど/バンド れいわ/令和 + -0.423096 ばんなー/バンナー の/の + -0.977929 ばんねん/晩年 、/、 + -1.951219 ばんねん/晩年 ちぇんと/チェント +@@ -983012,6 +983118,27 @@ ngram 3=1777469 + -0.435055 れいや/礼弥 が/が + -0.386229 れいりょう/冷涼 な/な + -0.337473 れいりょく/霊力 の/の ++-1.631774 れいわ/令和 がんねん/元年 ++-2.385788 れいわ/令和 き/期 ++-2.389205 れいわ/令和 しょき/初期 ++-1.889243 れいわ/令和 に/に ++-1.220548 れいわ/令和 の/の ++-2.389054 れいわ/令和 ひゃく/百 ++-2.076129 れいわ/令和 13/13 ++-1.350044 れいわ/令和 14/14 ++-1.941192 れいわ/令和 15/15 ++-1.838638 れいわ/令和 16/16 ++-1.380380 れいわ/令和 17/17 ++-1.488244 れいわ/令和 19/19 ++-1.487973 れいわ/令和 20/20 ++-1.121761 れいわ/令和 21/21 ++-1.011954 れいわ/令和 22/22 ++-0.814327 れいわ/令和 23/23 ++-1.413459 れいわ/令和 24/24 ++-1.935069 れいわ/令和 3/3 ++-1.486893 れいわ/令和 5/5 ++-1.938869 れいわ/令和 6/6 ++-1.630934 れいわ/令和 8/8 + -0.567635 れいんぼー/レインボー ・/・ + -0.778711 れいヴ/レイヴ の/の + -0.841983 れいヴ/レイヴ みゅーじっく/ミュージック +@@ -984414,6 +984541,7 @@ ngram 3=1777469 + -2.896014 ・/・ やまだ/山田 + -2.930190 ・/・ ゆうじん/友人 + -2.944364 ・/・ りあ/リア ++-2.906587 ・/・ れいわ/令和 + -2.924855 ・/・ れんじゃー/レンジャー + -2.924635 ・/・ れんらく/連絡 + -2.946224 ・/・ ろてん/露天 +@@ -987096,6 +987224,8 @@ ngram 3=1777469 + -0.608174 ”/“ りか/リカ ちゃん/ちゃん + -0.449758 ”/“ りっぷす/リップス ”/“ + -0.435446 ”/“ りゅどべっく/リュドベック と/と ++-0.930163 ”/“ れいわ/令和 17/17 ++-0.950328 ”/“ れいわ/令和 24/24 + -0.773219 ”/“ ろしあ/ロシア ・/・ + -0.423096 ”/“ ろろ/ロロ の/の + -0.807001 ”/“ ろんぐ/ロング ヴぁーじょん/ヴァージョン +@@ -1007476,6 +1007606,7 @@ ngram 3=1777469 + -1.617003 、/、 きんねん/近年 まで/まで + -2.147120 、/、 きんねん/近年 も/も + -2.486017 、/、 きんねん/近年 らくろす/ラクロス ++-2.485168 、/、 きんねん/近年 れいわ/令和 + -0.450937 、/、 きんぱく/金箔 が/が + -0.471633 、/、 きんぱつ/金髪 で/で + -0.757392 、/、 きんぱつ/金髪 に/に +@@ -1017385,6 +1017516,7 @@ ngram 3=1777469 + -3.137793 、/、 さらに/さらに りようじ/領地 + -3.141943 、/、 さらに/さらに るーつ/ルーツ + -3.136294 、/、 さらに/さらに れいぞう/冷蔵 ++-3.128506 、/、 さらに/さらに れいわ/令和 + -3.143082 、/、 さらに/さらに れヴぁーむ/レヴァーム + -3.143578 、/、 さらに/さらに ろくぶくろ/六袋 + -3.135173 、/、 さらに/さらに わかやま/和歌山 +@@ -1067127,6 +1067259,33 @@ ngram 3=1777469 + -0.269784 、/、 れいゆう/霊友 かい/会 + -0.435446 、/、 れいら/澪ら と/と + -0.587489 、/、 れいらく/零落 し/し ++-2.358283 、/、 れいわ/令和 いこう/以降 ++-2.362320 、/、 れいわ/令和 いご/以後 ++-2.009704 、/、 れいわ/令和 がんねん/元年 ++-2.352861 、/、 れいわ/令和 けんきゅう/研究 ++-2.158491 、/、 れいわ/令和 こくさい/国際 ++-1.811125 、/、 れいわ/令和 に/に ++-1.479723 、/、 れいわ/令和 の/の ++-2.363743 、/、 れいわ/令和 ふきょう/不況 ++-2.025230 、/、 れいわ/令和 を/を ++-2.009533 、/、 れいわ/令和 11/11 ++-1.600889 、/、 れいわ/令和 12/12 ++-1.601166 、/、 れいわ/令和 13/13 ++-1.865891 、/、 れいわ/令和 15/15 ++-1.484065 、/、 れいわ/令和 17/17 ++-1.050683 、/、 れいわ/令和 18/18 ++-1.257582 、/、 れいわ/令和 20/20 ++-1.089914 、/、 れいわ/令和 21/21 ++-1.228628 、/、 れいわ/令和 22/22 ++-1.322824 、/、 れいわ/令和 23/23 ++-1.538172 、/、 れいわ/令和 24/24 ++-1.320788 、/、 れいわ/令和 3/3 ++-1.598736 、/、 れいわ/令和 4/4 ++-1.669406 、/、 れいわ/令和 5/5 ++-1.863434 、/、 れいわ/令和 6/6 ++-2.007188 、/、 れいわ/令和 7/7 ++-2.007188 、/、 れいわ/令和 8/8 ++-2.007842 、/、 れいわ/令和 9/9 + -0.772449 、/、 れいん/レイン ぼーすねーく/ボースネーク + -0.713319 、/、 れいんぼー/レインボー が/が + -0.629087 、/、 れいヴ/レイヴ を/を +@@ -1089144,6 +1089303,11 @@ ngram 3=1777469 + -0.440704 「/「 れいぷれい/レイプレイ 」/」 + -0.712923 「/「 れいめい/黎明 えん/苑 + -0.594935 「/「 れいらく/零落 びゃくや/白夜 ++-1.569883 「/「 れいわ/令和 」/」 ++-1.631355 「/「 れいわ/令和 かい/会 ++-1.634686 「/「 れいわ/令和 にじゅう/二十 ++-1.283898 「/「 れいわ/令和 22/22 ++-1.443210 「/「 れいわ/令和 23/23 + -0.867180 「/「 れいん/レイン めーかー/メーカー + -1.004129 「/「 れいん/レイン ・/・ + -1.083155 「/「 れいんぼー/レインボー と/と +@@ -1090233,6 +1090397,7 @@ ngram 3=1777469 + -2.937822 」/」 、/、 りゃく/略 + -3.618769 」/」 、/、 りょかく/旅客 + -3.679327 」/」 、/、 れいみ/レイミ ++-3.526590 」/」 、/、 れいわ/令和 + -3.672356 」/」 、/、 ろいたー/ロイター + -3.678184 」/」 、/、 ろんぴょう/論評 + -3.650236 」/」 、/、 わかはやし/若林 +@@ -1091844,6 +1092009,7 @@ ngram 3=1777469 + -3.506722 」/」 が/が りりーす/リリース + -3.528829 」/」 が/が りんせつ/隣接 + -3.664991 」/」 が/が りーど/リード ++-3.725708 」/」 が/が れいわ/令和 + -3.658417 」/」 が/が れぎゅらー/レギュラー + -3.608343 」/」 が/が れんごう/連合 + -2.783667 」/」 が/が わか/わか +@@ -1095839,6 +1096005,7 @@ ngram 3=1777469 + -4.069721 」/」 の/の れいじょう/令嬢 + -3.441830 」/」 の/の れいぞう/冷蔵 + -4.092454 」/」 の/の れいてき/霊的 ++-4.025474 」/」 の/の れいわ/令和 + -3.131025 」/」 の/の れきし/歴史 + -4.037316 」/」 の/の れきだい/歴代 + -3.341149 」/」 の/の れぎゅらー/レギュラー +@@ -1096790,6 +1096957,7 @@ ngram 3=1777469 + -0.600158 」/」 るびー/ルビー が/が + -0.381029 」/」 るーにー/ルーニー ・/・ + -0.269610 」/」 れいき/霊亀 3/3 ++-0.711896 」/」 れいわ/令和 18/18 + -0.807349 」/」 れっど/レッド たーぼ/ターボ + -0.727936 」/」 れつでん/列伝 12/12 + -1.003746 」/」 れべる/レベル +@@ -1098326,6 +1098494,7 @@ ngram 3=1777469 + -3.041535 」/」 (/( る/る + -3.845684 」/」 (/( るびーじゅ/ルビージュ + -3.761063 」/」 (/( れい/零 ++-2.472379 」/」 (/( れいわ/令和 + -3.688119 」/」 (/( れきし/歴史 + -3.846517 」/」 (/( れんあい/れんあい + -3.843633 」/」 (/( ろーたー/ローター +@@ -1117815,6 +1117984,7 @@ ngram 3=1777469 + -3.003783 あと/後 の/の よしとよ/嘉豊 + -3.003783 あと/後 の/の りゅうきゃく/竜脚 + -3.003656 あと/後 の/の りんろう/琳琅 ++-2.984466 あと/後 の/の れいわ/令和 + -2.814098 あと/後 の/の 10/10 + -3.003558 あと/後 の/の 1651/1651 + -3.003558 あと/後 の/の 1763/1763 +@@ -1124828,6 +1124998,7 @@ ngram 3=1777469 + -3.048601 あらた/新た な/な りょうど/領土 + -3.053679 あらた/新た な/な りんごく/隣国 + -1.419367 あらた/新た な/な る/る ++-3.071442 あらた/新た な/な れいわ/令和 + -3.075069 あらた/新た な/な れこーでぃんぐ/レコーディング + -3.033711 あらた/新た な/な ろせん/路線 + -2.001811 あらた/新た に/に 、/、 +@@ -1143165,6 +1143336,7 @@ ngram 3=1777469 + -4.546438 い/い て/て るり/ルリ + -4.538127 い/い て/て るーかす/ルーカス + -4.551299 い/い て/て れいしょう/冷笑 ++-4.289886 い/い て/て れいわ/令和 + -4.236385 い/い て/て れっしゃ/列車 + -4.536074 い/い て/て れっせい/劣勢 + -4.551299 い/い て/て れんえい/聯営 +@@ -1147985,6 +1148157,7 @@ ngram 3=1777469 + -5.062222 い/い る/る れいじん/霊人 + -5.061103 い/い る/る れいそく/令息 + -5.055900 い/い る/る れいぶん/例文 ++-4.301811 い/い る/る れいわ/令和 + -3.919390 い/い る/る れきし/歴史 + -5.057628 い/い る/る れせぷと/レセプト + -4.543427 い/い る/る れっしゃ/列車 +@@ -1148429,6 +1148602,7 @@ ngram 3=1777469 + -2.867723 い/い (/( よう/要 + -2.877440 い/い (/( よん/四 + -2.146162 い/い (/( れい/例 ++-2.598525 い/い (/( れいわ/令和 + -2.894149 い/い (/( わか/分か + -2.316390 い/い (/( (/( + -2.579567 い/い (/( 2010/2010 +@@ -1248353,6 +1248527,7 @@ ngram 3=1777469 + -2.665006 かい/会 、/、 むらさき/むらさき + -2.569341 かい/会 、/、 もと/元 + -2.645495 かい/会 、/、 りんじ/臨時 ++-2.630198 かい/会 、/、 れいわ/令和 + -2.585900 かい/会 、/、 11/11 + -2.606999 かい/会 、/、 14/14 + -2.655630 かい/会 、/、 1915/1915 +@@ -1249436,6 +1249611,7 @@ ngram 3=1777469 + -2.709124 かい/会 (/( まじゅれせ/マジュレセ + -2.680569 かい/会 (/( みやざき/宮崎 + -2.699263 かい/会 (/( ら/ラ ++-2.490194 かい/会 (/( れいわ/令和 + -1.329268 かい/会 (/( )/) + -2.671389 かい/会 (/( 1937/1937 + -0.863875 かい/会 )/) +@@ -1294888,6 +1295064,8 @@ ngram 3=1777469 + -0.690661 から/から れいさい/零細 きぎょう/企業 + -0.692486 から/から れいすい/冷水 に/に + -0.448855 から/から れいほん/零本 まで/まで ++-1.103505 から/から れいわ/令和 へ/へ ++-1.067919 から/から れいわ/令和 11/11 + -0.824296 から/から れきし/歴史 てき/的 + -0.892140 から/から れきし/歴史 を/を + -1.492935 から/から れぎゅらー/レギュラー いり/入り +@@ -1318739,6 +1318917,7 @@ ngram 3=1777469 + -4.745109 が/が 、/、 れいてき/霊的 + -4.519393 が/が 、/、 れいはい/礼拝 + -4.849608 が/が 、/、 れいめいろく/黎明録 ++-3.128605 が/が 、/、 れいわ/令和 + -4.483062 が/が 、/、 れおん/レオン + -3.360382 が/が 、/、 れきし/歴史 + -4.256668 が/が 、/、 れぎゅらー/レギュラー +@@ -1340573,6 +1340752,8 @@ ngram 3=1777469 + -0.220503 が/が れいめい/黎明 き/期 + -0.656499 が/が れいりー/レイリー さんらん/散乱 + -0.567635 が/が れいんぼー/レインボー ・/・ ++-1.041737 が/が れいわ/令和 14/14 ++-0.971453 が/が れいわ/令和 21/21 + -0.423096 が/が れかい/レカイ の/の + -0.400818 が/が れき/礫 を/を + -1.518366 が/が れきし/歴史 しょうせつ/小説 +@@ -1351059,6 +1351240,7 @@ ngram 3=1777469 + -3.788976 がつ/月 、/、 りヴぃう/リヴィウ + -3.774657 がつ/月 、/、 るす/留守 + -3.565542 がつ/月 、/、 るーまにあ/ルーマニア ++-3.516297 がつ/月 、/、 れいわ/令和 + -3.801495 がつ/月 、/、 れおーね/レオーネ + -3.782618 がつ/月 、/、 れじゃー/レジャー + -3.657551 がつ/月 、/、 れんたい/連隊 +@@ -1353055,6 +1353237,7 @@ ngram 3=1777469 + -2.037630 がつ/月 (/( ばあい/場合 + -1.985517 がつ/月 (/( へいせい/平成 + -2.042334 がつ/月 (/( ゆりうす/ユリウス ++-1.985517 がつ/月 (/( れいわ/令和 + -1.996436 がつ/月 (/( 10/10 + -2.040274 がつ/月 (/( 110/110 + -2.044093 がつ/月 (/( 1132/1132 +@@ -1392049,6 +1392232,7 @@ ngram 3=1777469 + -2.311153 きんねん/近年 の/の りゅうこう/流行 + -2.317571 きんねん/近年 の/の りょうこく/両国 + -2.292577 きんねん/近年 の/の りよう/利用 ++-2.315678 きんねん/近年 の/の れいわ/令和 + -0.889973 きんねん/近年 は/は 、/、 + -2.473947 きんねん/近年 は/は あらた/新た + -2.487164 きんねん/近年 は/は いりょう/医療 +@@ -1392112,6 +1392296,7 @@ ngram 3=1777469 + -0.813950 きんねん/近年 より/より かいがい/海外 + -0.618407 きんねん/近年 らくろす/ラクロス に/に + -0.492904 きんねん/近年 りにゅーある/リニューアル し/し ++-0.711910 きんねん/近年 れいわ/令和 17/17 + -0.809917 きんねん/近年 (/( 2010/2010 + -0.521725 きんのう/勤王 せいさく/政策 を/を + -0.685197 きんのう/勤王 とう/党 と/と +@@ -1393773,6 +1393958,9 @@ ngram 3=1777469 + -1.115002 ぎかい/議会 も/も じこ/事故 + -1.115178 ぎかい/議会 も/も りっち/立地 + -0.814132 ぎかい/議会 や/や こくぼう/国防 ++-1.399240 ぎかい/議会 れいわ/令和 ねん/年 ++-1.261648 ぎかい/議会 れいわ/令和 16/16 ++-0.636105 ぎかい/議会 れいわ/令和 20/20 + -1.656499 ぎかい/議会 を/を かいさん/解散 + -1.656112 ぎかい/議会 を/を こうしき/公式 + -1.659263 ぎかい/議会 を/を しょうしゅう/召集 +@@ -1396710,6 +1396898,7 @@ ngram 3=1777469 + -1.415491 ぎょうせい/行政 、/、 りっぽう/立法 + -0.667107 ぎょうせい/行政 」/」 と/と + -1.115208 ぎょうせい/行政 」/」 へいせい/平成 ++-1.115208 ぎょうせい/行政 」/」 れいわ/令和 + -0.557954 ぎょうせい/行政 あんぜんべ/安全部 の/の + -0.091145 ぎょうせい/行政 いいん/委員 かい/会 + -1.627023 ぎょうせい/行政 いん/院 いん/院 +@@ -1407630,6 +1407819,9 @@ ngram 3=1777469 + -0.556054 くうはく/  れいぎ/礼儀 ただし/正し + -0.622242 くうはく/  れいて/レイテ おき/沖 + -0.278239 くうはく/  れいはい/礼拝 どう/堂 ++-1.404028 くうはく/  れいわ/令和 なん/何 ++-0.653319 くうはく/  れいわ/令和 14/14 ++-1.138593 くうはく/  れいわ/令和 18/18 + -0.449351 くうはく/  れんば/レンバ けん/県 + -0.811842 くうはく/  ろしあ/ロシア 10/10 + -0.746805 くうはく/  わか/分 っ/っ diff --git a/SOURCES/libkkc-data-HEAD.patch b/SOURCES/libkkc-data-HEAD.patch new file mode 100644 index 0000000..af52f9a --- /dev/null +++ b/SOURCES/libkkc-data-HEAD.patch @@ -0,0 +1,128 @@ +diff --git a/tools/genfilter.py b/tools/genfilter.py +index 5ffab32..0c5f75a 100644 +--- a/tools/genfilter.py ++++ b/tools/genfilter.py +@@ -84,24 +84,24 @@ class FilterGenerator(object): + + def generate(self): + size = os.fstat(self.infile.fileno()).st_size +- n = size / self.record_size ++ n = size // self.record_size + m = int(math.ceil(-n*math.log10(ERROR_RATE) / + math.pow(math.log10(2), 2))) +- m = (m/8 + 1)*8 ++ m = (m//8 + 1)*8 + inmem = mmap.mmap(self.infile.fileno(), + size, + access=mmap.ACCESS_READ) +- outmem = bytearray(m/8) +- for i in xrange(0, n): ++ outmem = bytearray(m//8) ++ for i in range(0, n): + offset = i*self.record_size + b0, b1 = struct.unpack("=LL", inmem[offset:offset+8]) +- for k in xrange(0, 4): ++ for k in range(0, 4): + h = murmur_hash3_32(b0, b1, k) + h = int(h * (m / float(0xFFFFFFFF))) +- outmem[h/8] |= (1 << (h%8)) ++ outmem[h//8] |= (1 << (h%8)) + inmem.close() +- # Convert bytearray to str, for Python 2.6 compatibility. +- self.outfile.write(str(outmem)) ++ # Convert bytearray to bytes, for Python 3 compatibility. ++ self.outfile.write(bytes(outmem)) + + if __name__ == '__main__': + import sys +@@ -110,7 +110,7 @@ if __name__ == '__main__': + parser = argparse.ArgumentParser(description='filter') + parser.add_argument('infile', type=argparse.FileType('r'), + help='input file') +- parser.add_argument('outfile', type=argparse.FileType('w'), ++ parser.add_argument('outfile', type=argparse.FileType('wb'), + help='output file') + parser.add_argument('record_size', type=int, + help='record size') +diff --git a/tools/sortlm.py b/tools/sortlm.py +index a0dd8fe..40f0837 100644 +--- a/tools/sortlm.py ++++ b/tools/sortlm.py +@@ -40,10 +40,10 @@ class SortedGenerator(object): + self.__min_cost = 0.0 + + def read(self): +- print "reading N-grams" ++ print("reading N-grams") + self.__read_tries() + self.__read_ngrams() +- print "min cost = %lf" % self.__min_cost ++ print("min cost = %lf" % self.__min_cost) + + def __read_tries(self): + while True: +@@ -58,7 +58,7 @@ class SortedGenerator(object): + line = self.__infile.readline() + if line == "": + break +- line = line.strip() ++ line = line.strip('\n') + if line == "": + break + match = self.__ngram_line_regex.match(line) +@@ -89,7 +89,7 @@ class SortedGenerator(object): + line = self.__infile.readline() + if line == "": + break +- line = line.strip() ++ line = line.strip('\n') + if line == "": + break + match = self.__ngram_line_regex.match(line) +@@ -125,14 +125,11 @@ class SortedGenerator(object): + def quantize(cost, min_cost): + return max(0, min(65535, int(cost * 65535 / min_cost))) + +- def cmp_header(a, b): +- return cmp(a[0], b[0]) +- +- print "writing 1-gram file" ++ print("writing 1-gram file") + unigram_offsets = {} + unigram_file = open("%s.1gram" % self.__output_prefix, "wb") + offset = 0 +- for ids, value in sorted(self.__ngram_entries[0].iteritems()): ++ for ids, value in sorted(self.__ngram_entries[0].items()): + unigram_offsets[ids[0]] = offset + s = struct.pack("=HHH", + quantize(value[0], self.__min_cost), +@@ -143,13 +140,13 @@ class SortedGenerator(object): + offset += 1 + unigram_file.close() + +- print "writing 2-gram file" ++ print("writing 2-gram file") + bigram_offsets = {} + bigram_file = open("%s.2gram" % self.__output_prefix, "wb") + keys = self.__ngram_entries[1].keys() + items = [(struct.pack("=LL", ids[1], unigram_offsets[ids[0]]), ids) for ids in keys] + offset = 0 +- for header, ids in sorted(items, cmp=cmp_header): ++ for header, ids in sorted(items, key=lambda x: x[0]): + value = self.__ngram_entries[1][ids] + bigram_offsets[ids] = offset + s = struct.pack("=HH", +@@ -160,11 +157,11 @@ class SortedGenerator(object): + bigram_file.close() + + if len(self.__ngram_entries[2]) > 0: +- print "writing 3-gram file" ++ print("writing 3-gram file") + trigram_file = open("%s.3gram" % self.__output_prefix, "wb") + keys = self.__ngram_entries[2].keys() + items = [(struct.pack("=LL", ids[2], bigram_offsets[(ids[0], ids[1])]), ids) for ids in keys] +- for header, ids in sorted(items, cmp=cmp_header): ++ for header, ids in sorted(items, key=lambda x: x[0]): + value = self.__ngram_entries[2][ids] + s = struct.pack("=H", + quantize(value[0], self.__min_cost)) diff --git a/SPECS/libkkc-data.spec b/SPECS/libkkc-data.spec new file mode 100644 index 0000000..631e9db --- /dev/null +++ b/SPECS/libkkc-data.spec @@ -0,0 +1,88 @@ +%global debug_package %{nil} + +Name: libkkc-data +Version: 0.2.7 +Release: 12%{?dist} +Epoch: 1 +Summary: Language model data for libkkc + +License: GPLv3+ +URL: https://bitbucket.org/libkkc +Source0: https://bitbucket.org/libkkc/libkkc-data/downloads/%{name}-%{version}.tar.xz + +# Upstream commit https://github.com/ueno/libkkc/commit/ba1c1bd3eb86d887fc3689c3142732658071b5f7 +Patch0: libkkc-data-HEAD.patch +# bug 1720044 +Patch1: %{name}-1720044-reiwa.patch + +BuildRequires: python3-devel +BuildRequires: python3-marisa + +%description +The %{name} package contains the language model data that libkkc uses +at run time. + + +%prep +%setup -q +%patch0 -p1 -b .HEAD +%patch1 -p1 -b .reiwa + + +%build +%configure --disable-static PYTHON=python3 +make %{?_smp_mflags} + + +%install +%make_install INSTALL="install -p" + + +%files +%doc COPYING +%{_libdir}/libkkc + + +%changelog +* Mon Jun 17 2019 Takao Fujiwara - 1:0.2.7-12 +- Resolves: #1720044 - Include Reiwa/The new Japanese era + +* Tue Aug 14 2018 Parag Nemade - 1:0.2.7-11 +- Resolves:rh#1615534: libkkc-data FTBFS for missing BuildRequires +- moved this package to use python3 + +* Wed Feb 07 2018 Fedora Release Engineering - 1:0.2.7-10 +- Rebuilt for https://fedoraproject.org/wiki/Fedora_28_Mass_Rebuild + +* Thu Aug 03 2017 Fedora Release Engineering - 1:0.2.7-9 +- Rebuilt for https://fedoraproject.org/wiki/Fedora_27_Binutils_Mass_Rebuild + +* Wed Jul 26 2017 Fedora Release Engineering - 1:0.2.7-8 +- Rebuilt for https://fedoraproject.org/wiki/Fedora_27_Mass_Rebuild + +* Fri Feb 10 2017 Fedora Release Engineering - 1:0.2.7-7 +- Rebuilt for https://fedoraproject.org/wiki/Fedora_26_Mass_Rebuild + +* Thu Feb 04 2016 Fedora Release Engineering - 1:0.2.7-6 +- Rebuilt for https://fedoraproject.org/wiki/Fedora_24_Mass_Rebuild + +* Wed Jun 17 2015 Fedora Release Engineering - 1:0.2.7-5 +- Rebuilt for https://fedoraproject.org/wiki/Fedora_23_Mass_Rebuild + +* Sun Aug 17 2014 Fedora Release Engineering - 1:0.2.7-4 +- Rebuilt for https://fedoraproject.org/wiki/Fedora_21_22_Mass_Rebuild + +* Sat Jun 07 2014 Fedora Release Engineering - 1:0.2.7-3 +- Rebuilt for https://fedoraproject.org/wiki/Fedora_21_Mass_Rebuild + +* Fri Sep 20 2013 Daiki Ueno - 1:0.2.7-2 +- bump release to avoid NVR conflict + +* Fri Sep 20 2013 Daiki Ueno - 1:0.2.7-1 +- add COPYING to %%doc +- disable debuginfo +- add Epoch to avoid conflict with the libkkc package + +* Tue Sep 17 2013 Daiki Ueno - 0.2.7-1 +- initial packaging for Fedora, splitting from libkkc +