Tika檢測文件類型


Tika類型檢測

Tika支持MIME所提供的所有互聯網媒體文件類型。每當一個文件通過Tika檢測到該文件,其文件類型。檢測的介質類型,Tika內部通過以下機制。

MIME標准

多用途Internet郵件擴展(MIME)標准,用於識別文件類型的最佳標准。這些標准的知識有助於在內部相互作用的瀏覽器。

當瀏覽器遇到一個媒體文件,它選擇可用它來顯示其內容的兼容軟件。在情況下,它不具有任何合適的應用程序,以運行一個特定媒體文件,它建議用戶獲得合適的插件軟件。

使用Facade類類型檢測

facade類的detect() 方法被用於檢測文檔類型。這個方法接受一個文件作為輸入。

下面顯示的是文件類型檢測與Tika外觀類的示例程序。

  • 傳入參數為File對象時
  @Test
    public void getImageToJPEG() {
        try {
            File file = new File("C:\\Users\\hww\\Downloads\\0855fde2df59fa4fe9427e78d773dde5.jpeg");
            Tika tika = new Tika();
            String fileType = tika.detect(file);
            System.out.println(fileType);//image/jpeg
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

輸出結果

image/jpeg
  • 傳入參數為文件路徑時
   @Test
    public void getImageToJPG() {
        try {
            Tika tika = new Tika();
            String fileType = tika.detect("C:\\Users\\hww\\Downloads\\95a59c718b2575fdbccf66924c14fcd5.jpg");
            System.out.println(fileType);//image/jpeg
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

輸入結果:

image/jpeg
  • detect()方法參數有以下幾種:

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM