個人化向量字型 a vectorized font personalizing system
DESCRIPTION
個人化向量字型 A Vectorized Font Personalizing System. 研究生 : 謝忠勳 指導教授:蔣依吾 博士 中山大學資訊工程學系. 個人化商品. 統一規格化商品及個人化商品 個人化字型. 相關研究. 將手寫字元分解為構成之筆畫,再依垂直、水平及二對角線之筆畫方向予以分類,並推導筆畫之對應長度後,與標準字元進行比對 [X. Gao,2001] 線上即時( on-line )辨識則將書寫時之筆尖壓力及筆畫順序等特徵納入 [T. Qu,2003]. 研究目標. 標準字元處理 手寫字元分析 特徵套用. 常用字型. 點陣字型 - PowerPoint PPT PresentationTRANSCRIPT
個人化向量字型A Vectorized Font
Personalizing System
研究生:謝忠勳 指導教授:蔣依吾 博士中山大學資訊工程學系
個人化商品 •統一規格化商品及個人化商品•個人化字型
相關研究• 將手寫字元分解為構成之筆畫,再依垂直、水平及二對角線之筆畫方向予以分類,並推導筆畫之對應長度後,與標準字元進行比對 [X. Gao,2001]
• 線上即時( on-line )辨識則將書寫時之筆尖壓力及筆畫順序等特徵納入 [T. Qu,2003]
研究目標• 標準字元處理
• 手寫字元分析
• 特徵套用
常用字型 • 點陣字型 (1) 由正方形黑白點矩陣儲存字元 (2) 改變字型大小,易鋸齒狀失真
• 向量字型 (1) 以曲線公式勾勒文字
(2) 以控制點組成字元 (3) 以表格方式儲存
放大 9 倍的點陣字 放大 9 倍的向量字
Glyf Table
flags[0]
1
flags[1]
0
flags[2]
1
flags[3]
1
flags[4]
0
flags[5]
1
Y 座標[ 0]
247
Y 座標[ 1]
-67
Y 座標[ 2]
-69
Y 座標[ 3]
-45
Y 座標[ 4]
63
Y 座標[ 5]
75
X 座標[ 0]
787
X 座標[ 1]
-118
X 座標[ 2]
-212
X 座標[ 3]
18
X 座標[ 4]
201
X 座標[ 5]
131
向量字型
• 不具筆畫數目觀念• 不具筆畫順序概念
輪廓 - 方向與顏色
•輪廓方向 : 順時針與逆時針•重疊部分的顏色控制
標準字元處理
A handwritten character
字元分割• 根據正交投影法,將字元影像分別投影
至 X 及 Y 軸,即可將字元切割成字根組成。
• 屬於左右比例為 1:2 之分割
• 接下來拿“吐”字元中之“土”字根為例子
土之輪廓• 土的輪廓數為 1
線段分類• 將輪廓中各個線段之控制點相對於其前一個控制點間空間關係分類,共可分為區分為垂直、水平、往左撇、往右撇四個方向 。
將線段具有筆畫之概念• 同一個筆畫中之線段必須相同。
兩垂直線段兩水平線段
將線段較短者之方向改成與線段較長者相同
四垂直線段
• 根據筆畫方向累積的線段數目 土字的水平筆畫線段累積數目 11
垂直筆畫線段累積數目 5
左撇筆畫線段累積數目 0
右撇筆畫線段累積數目 0
12 5
4
3 6
7
11
98 10
1 3
54
2
• 土的控制點數目為 16
1 56
4
7
3
2
10 9
8
1112
1314
15 16
土之控制點數目
土之控制點相對關係• 根據起始的控制點去推算出所需要知道的線段是屬於哪一種筆畫線段
起始點
要判斷由點 11及點 12構成之線段為垂直筆畫線段
1 56
4
7
3
2
10 9
8
1112
1314
15 16
• 若有兩個字根在以上判斷均是相同的,則必須由控制點座標來加以判斷
EX: 土 & 士
• 综合以上特徵,即可順利找出標準中文字集中,各個字根是屬於何種字根 (EX:土、木、王…等 ) ,並記錄下來。
手寫字元分析
字元、字根階層• 分析手寫字元之字根組成及字根長寬比
筆畫階層• 記錄各筆畫長度及斜率• 紀錄相交筆畫之交點至各端點間線段長度比例
r1
r2
r3r4
r11
r21
r12
r22
• 在個人化標楷體字型還另外記錄原標楷體提筆及收筆時在不同筆畫時之特徵。
特徵套用• 根據前述所擷取之特徵,變更原標準中文字控制點。以下以土為例,依序將手寫特徵套用至標準字型
標準細黑體“土”字 手寫影像
套用筆畫長度 套用各相交筆畫之交點至各端點間線段長度比例
套用斜率
研究結果
字根修改數據• 總共字元數: 8763
完全修改字元數: 3315
修改到一個字根: 1836
修改到二個字根: 1527
修改到三個字根以上: 1764
完全沒修改到字元數: 321
完全修改率: 38 %
部分修改率: 96 %
結論• 字元中具有較多比例之可分析字根者,
具有較好之結果• 未來發展﹕
①尋求更適合之字型檔,以提高字根分析之能力
②增加字根分析數量,提高字庫個人化比例