close
上個星期三(7/8),劉炯朗校長的題目延續在統計數學的幾個現象,但話鋒一轉,轉到了資料壓縮上。
資料壓縮的意義,就是在以比較少的表達方式盡可能地表達出原本的意思。
當然,校長舉了很多的例子,像是mp3,照片,也把失真壓縮跟不失真壓縮的定義講了一下。
有趣的是,校長總是會出人意料的講到其他地方,
例如,詩的壓縮。把一首七言絕句壓成五言絕句:
清明時節雨紛紛路上行人欲斷魂借問酒家何處去牧童遙指杏花村
清明時節意思重覆,砍一個;行人當然走在路上,路上砍掉。
何處去就有問的意思,借問就不用了,砍掉。
誰回答的不重要,牧童砍掉。
清明雨紛紛
行人欲斷魂
酒家何處去
遙指杏花村
另外,校長也講到簡體字跟正體字,他認為這也是一種壓縮,
像是「塵」,改成「尘」。意思不變,筆劃變少。是一種無失真壓縮。
像是樹「幹」、「乾」淨,都改成「干」,就是一種失真的壓縮。
我個人對於正體字與簡體字的意見是,失真的壓縮,最好不要。
簡體字中自創的寫法也不要,使用古體字的倒是可以,
如「无」就是「無」的古體字。
其實,我與朋友以前也有就英文與中文之間論過一遍。
倒底,同一篇文章,用英文寫比較少還是用中文寫比較少。
大家可以想想看…
答案會因為計算單位的不同而有不同。
如果是用中文字對一個英字(word),結果會如何?這種算法是很多人的比較方式。
但是我的計算方式是中文的壓縮能力,因此計算的可以是用掉幾個 byte 來算。
或者是,佔去紙的面積多少來計算,結果又不一樣。
當然也會有人拿中文筆劃數與字母數來比,這些都可以來算算。
今天到這裡。
全站熱搜