/usr/share/chasen/ipadic.rc is in ipadic-common 2.7.0+main-3.
This file is owned by root:root, with mode 0o644.
The actual contents of the file can be viewed below.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 | ;;
;; chasenrc for ipadic-2.7.0-main
;;
;; 日本語ラベルと英語ラベルどちらか指定するだけで良い
;;;
;;; grammar.cha/ctypes.cha/cforms.cha location /文法ファイル
;;;
;(文法ファイル /var/lib/chasen/dic/debian)
(GRAMMAR /var/lib/chasen/dic/debian)
;;;
;;; dictionary /辞書
;;;
(DADIC chadic)
;;;
;;; POS for Unknown words /未知語品詞
;;;
;(未知語品詞 (名詞 サ変接続))
(UNKNOWN_POS (名詞 サ変接続))
;;;
;;; output format /出力フォーマット
;;;
;(出力フォーマット "%m\t%y\t%M\t%U(%P-)\t%T \t%F \n") ; default(-f)
;(OUTPUT_FORMAT "%m\t%y\t%M\t%U(%P-)\t%T \t%F \n") ; default(-f)
;(OUTPUT_FORMAT "%m\t%y\t%M\t%P-\t%T \t%F \n") ; POS name
;(OUTPUT_FORMAT "%m\t%?U/UNKNOWN/%y/\t%M\t%h/%t/%f\n") ; POS code
;(OUTPUT_FORMAT "%M\t%P-\n")
;;;
;;; output format for compound words /複合語出力
;;;
;(複合語出力 "COMPOUND") ; default
;(OUTPUT_COMPOUND "COMPOUND") ; default
;(OUTPUT_COMPOUND "SEG")
;;;
;;; BOS string /BOS文字列
;;;
;(BOS文字列 "BOS")
;(BOS_STRING "BOS")
;;;
;;; EOS string /EOS文字列
;;;
;(EOS文字列 "EOS")
;(EOS_STRING "EOS")
;;;
;;; Connection cost for Undefined contexts /未定義連接コスト
;;;
;(未定義連接コスト 10000)
(DEF_CONN_COST 10000)
;;;
;;; POS Weight /品詞コスト
;;;
;(品詞コスト
; ((*) 1)
; ((UNKNOWN) 30000)
;)
(POS_COST
((*) 1)
((UNKNOWN) 30000)
)
;;;
;;; connecition rules Weight /連接コスト重み
;;;
;(連接コスト重み 1)
(CONN_WEIGHT 1)
;;;
;;; morphemes Weight /形態素コスト重み
;;;
;(形態素コスト重み 1)
(MORPH_WEIGHT 1)
;;;
;;; cost width /コスト幅
;;;
;(コスト幅 0)
(COST_WIDTH 0)
;;;
;;; composit POSs /連結品詞
;;;
;(連結品詞 ((名詞 数))
; ((記号 アルファベット)))
;(COMPOSIT_POS ((名詞 数))
; ((記号 アルファベット)))
;;;
;;; POSs as white space /空白品詞
;;;
;(空白品詞 (記号 空白))
;(SPACE_POS (記号 空白))
;;;
;;; annotation POSs /注釈
;;;
;(注釈 (("<" ">") (記号 一般)))
;(ANNOTATION (("<" ">") (記号 一般)))
;;;
;;; delimiter for option -j /区切り文字
;;;
;(区切り文字 "。.、,!?.,!? ")
;(DELIMITER "。.、,!?.,!? ")
(ENCODE "u")
|