『壹』 繪聲繪影 打開電影字幕文件utf 請問utf是什麼
UIF是一種字幕二進制的文本格式,全世界通用,此種格式在任何計算機上也不會產生亂碼。在會聲會影中你打上字幕,有個保存為字幕文件的,就有這種格式。
UTF,是Unicode Text Format的縮寫,意為Unicode文本格式。對於UTF,是這樣定義的:
(1)如果Unicode的16位字元的頭9位是0,則用一個位元組表示,這個位元組的首位是「0」,剩下的7位與原字元中的後7位相同,如「\u0034」(0000 0000 0011 0100),用「34」 (0011 0100)表示;(與源Unicode字元是相同的);
(2)如果Unicode的16位字元的頭5位是0,則用2個位元組表示,首位元組是「110」開頭,後面的5位與源字元中除去頭5個零後的最高5位相同;第二個位元組以「10」開頭,後面的6位與源字元中的低6位相同。如「\u025d」(0000 0010 0101 1101),轉化後為「c99d」(1100 1001 1001 1101);
(3)如果不符合上述兩個規則,則用三個位元組表示。第一個位元組以「1110」開頭,後四位為源字元的高四位;第二個位元組以「10」開頭,後六位為源字元中間的六位;第三個位元組以「10」開頭,後六位為源字元的低六位;如「\u9da7」(1001 1101 1010 0111),轉化為「e9b6a7」(1110 1001 1011 0110 1010 0111);
可以這么描述JAVA程序中Unicode與UTF的關系,雖然不絕對:字元串在內存中運行時,表現為Unicode代碼,而當要保存到文件或其它介質中去時,用的是UTF。這個轉化過程是由writeUTF和readUTF來完成的。