close

上個星期三(7/8),劉炯朗校長的題目延續在統計數學的幾個現象,但話鋒一轉,轉到了資料壓縮上。
資料壓縮的意義,就是在以比較少的表達方式盡可能地表達出原本的意思。
當然,校長舉了很多的例子,像是mp3,照片,也把失真壓縮跟不失真壓縮的定義講了一下。
有趣的是,校長總是會出人意料的講到其他地方,
例如,詩的壓縮。把一首七言絕句壓成五言絕句:

清明時節雨紛紛
路上行人欲斷魂
借問酒家何處去
牧童遙指杏花村

清明時節意思重覆,砍一個;行人當然走在路上,路上砍掉。
何處去就有問的意思,借問就不用了,砍掉。
誰回答的不重要,牧童砍掉。

清明雨紛紛
行人欲斷魂
酒家何處去
遙指杏花村

另外,校長也講到簡體字跟正體字,他認為這也是一種壓縮,
像是「塵」,改成「尘」。意思不變,筆劃變少。是一種無失真壓縮。
像是樹「幹」、「乾」淨,都改成「干」,就是一種失真的壓縮。
我個人對於正體字與簡體字的意見是,失真的壓縮,最好不要。
簡體字中自創的寫法也不要,使用古體字的倒是可以,
如「无」就是「無」的古體字。

其實,我與朋友以前也有就英文與中文之間論過一遍。
倒底,同一篇文章,用英文寫比較少還是用中文寫比較少。
大家可以想想看…
答案會因為計算單位的不同而有不同。
如果是用中文字對一個英字(word),結果會如何?這種算法是很多人的比較方式。
但是我的計算方式是中文的壓縮能力,因此計算的可以是用掉幾個 byte 來算。
或者是,佔去紙的面積多少來計算,結果又不一樣。
當然也會有人拿中文筆劃數與字母數來比,這些都可以來算算。
今天到這裡。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 betaparticle 的頭像
    betaparticle

    betaparticle的部落格

    betaparticle 發表在 痞客邦 留言(0) 人氣()