java大文件(視頻)分片上傳


需求:

支持大文件批量上傳(20G)和下載,同時需要保證上傳期間用戶電腦不出現卡死等體驗;

內網百兆網絡上傳速度為12MB/S

服務器內存占用低

支持文件夾上傳,文件夾中的文件數量達到1萬個以上,且包含層級結構。

支持PC端全平台操作系統,Windows,Linux,Mac

支持文件和文件夾的批量下載,斷點續傳。刷新頁面后繼續傳輸。關閉瀏覽器后保留進度信息。

支持文件夾批量上傳下載,服務器端保留文件夾層級結構,服務器端文件夾層級結構與本地相同。

支持斷點續傳,關閉瀏覽器或刷新瀏覽器后仍然能夠保留進度。

支持文件夾結構管理,支持新建文件夾,支持文件夾目錄導航

交互友好,能夠及時反饋上傳的進度;

服務端的安全性,不因上傳文件功能導致JVM內存溢出影響其他功能使用;

最大限度利用網絡上行帶寬,提高上傳速度;

 

分析:

對於大文件的處理,無論是用戶端還是服務端,如果一次性進行讀取發送、接收都是不可取,很容易導致內存問題。所以對於大文件上傳,采用切塊分段上傳

從上傳的效率來看,利用多線程並發上傳能夠達到最大效率。

 

解決方案:

文件上傳頁面的前端可以選擇使用一些比較好用的上傳組件,例如百度的開源組件WebUploader,澤優軟件的up6,這些組件基本能滿足文件上傳的一些日常所需功能,如異步上傳文件,文件夾,拖拽式上傳,黏貼上傳,上傳進度監控,文件縮略圖,甚至是大文件斷點續傳,大文件秒傳。

 

在web項目中上傳文件夾現在已經成為了一個主流的需求。在OA,或者企業ERP系統中都有類似的需求。上傳文件夾並且保留層級結構能夠對用戶行成很好的引導,用戶使用起來也更方便。能夠提供更高級的應用支撐。

數據庫配置類DBConfig.java

import java.sql.Connection;

import java.sql.DriverManager;

import java.sql.SQLException;

import org.apache.commons.lang.StringUtils;

import down2.biz.DnFile;

import down2.biz.DnFileMySQL;

import down2.biz.DnFileOracle;

import down2.biz.DnFileSQL;

 

/**

 * 數據庫配置類

@author jmzy

*/

public class DBConfig {

    public String m_db="oracle";//sql,oracle,mysql

    String driver = "";

    String url = "";

    String name = "";

    String pass = "";

   

    //sql

    String sql_driver= "com.microsoft.sqlserver.jdbc.SQLServerDriver";

    String sql_url = "jdbc:sqlserver://127.0.0.1:1433;DatabaseName=up6";

    String sql_name = "sa";

    String sql_pass = "123456";

   

    //mysql

    String mysql_driver = "com.mysql.jdbc.Driver";

    String mysql_url = "jdbc:mysql://127.0.0.1:3306/up6?user=root&password=123456&characterEncoding=UTF-8";

   

    //oracle數據庫配置

    String oracle_driver = "oracle.jdbc.driver.OracleDriver";

    String oracle_url = "jdbc:oracle:thin:@localhost:1521:orcl";

    String oracle_name = "system";

    String oracle_pass = "123456";

   

    public DBConfig() {

               

        if( StringUtils.equals(this.m_db, "sql") )

        {

            this.driver = this.sql_driver;

            this.url = this.sql_url;

            this.name = this.sql_name;

            this.pass = this.sql_pass;

        }

        else if( StringUtils.equals(this.m_db, "mysql") )

        {

            this.driver = this.mysql_driver;

            this.url = this.mysql_url;

        }

        else if( StringUtils.equals(this.m_db, "oracle") )

        {

            this.driver = this.oracle_driver;

            this.url = this.oracle_url;

            this.name = this.oracle_name;

            this.pass = this.oracle_pass;

        }

    }

   

    public DBFile db() {       

        if( StringUtils.equals(this.m_db, "sql") ) return new DBFileSQL();

        else if( StringUtils.equals(this.m_db, "mysql") ) return new DBFileMySQL();

        else if( StringUtils.equals(this.m_db, "oracle") ) return new DBFileOracle();

        else return new DBFile();

    }

   

    public DnFile down() {

        if( StringUtils.equals(this.m_db, "sql") ) return new DnFileSQL();

        else if( StringUtils.equals(this.m_db, "mysql") ) return new DnFileMySQL();

        else if( StringUtils.equals(this.m_db, "oracle") ) return new DnFileOracle();

        else return new DnFile();      

    }

    public Connection getCon()

    {

        Connection con = null;

       

        try

        {

            Class.forName(this.driver).newInstance();//加載驅動。

            if (StringUtils.equals(this.m_db, "mysql")) con = DriverManager.getConnection(this.url);

            else con = DriverManager.getConnection(this.url,this.name,this.pass);

        }

        catch (SQLException e)

        {

            // TODO Auto-generated catch block

            e.printStackTrace();

        } catch (InstantiationException e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        } catch (IllegalAccessException e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        } catch (ClassNotFoundException e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        }

        return con;    

    }

}

 

該項目核心就是文件分塊上傳。前后端要高度配合,需要雙方約定好一些數據,才能完成大文件分塊,我們在項目中要重點解決的以下問題。

* 如何分片;

* 如何合成一個文件;

* 中斷了從哪個分片開始。

如何分,利用強大的js庫,來減輕我們的工作,市場上已經能有關於大文件分塊的輪子,雖然程序員的天性曾迫使我重新造輪子。但是因為時間的關系還有工作的關系,我只能罷休了。最后我選擇了百度的WebUploader來實現前端所需。

如何合,在合之前,我們還得先解決一個問題,我們如何區分分塊所屬那個文件的。剛開始的時候,我是采用了前端生成了唯一uuid來做文件的標志,在每個分片請求上帶上。不過后來在做秒傳的時候我放棄了,采用了Md5來維護分塊和文件關系。

在服務端合並文件,和記錄分塊的問題,在這方面其實行業已經給了很好的解決方案了。參考迅雷,你會發現,每次下載中的時候,都會有兩個文件,一個文件主體,另外一個就是文件臨時文件,臨時文件存儲着每個分塊對應字節位的狀態。

這些都是需要前后端密切聯系才能做好,前端需要根據固定大小對文件進行分片,並且請求中要帶上分片序號和大小。前端發送請求順利到達后台后,服務器只需要按照請求數據中給的分片序號和每片分塊大小(分片大小是固定且一樣的)算出開始位置,與讀取到的文件片段數據,寫入文件即可。

為了便於開發,我 將服務端的業務邏輯進行了如下划分,分成初始化,塊處理,文件上傳完畢等。

服務端的業務邏輯模塊如下

 

 

功能分析:

文件夾生成模塊

 

文件夾上傳完畢后由服務端進行掃描代碼如下

 

分塊上傳,分塊處理邏輯應該是最簡單的邏輯了,up6已經將文件進行了分塊,並且對每個分塊數據進行了標識,這些標識包括文件塊的索引,大小,偏移,文件MD5,文件塊MD5(需要開啟)等信息,服務端在接收這些信息后便可以非常方便的進行處理了。比如將塊數據保存到分布式存儲系統中

分塊上傳可以說是我們整個項目的基礎,像斷點續傳、暫停這些都是需要用到分塊。

分塊這塊相對來說比較簡單。前端是采用了webuploader,分塊等基礎功能已經封裝起來,使用方便。

借助webUpload提供給我們的文件API,前端就顯得異常簡單。

前台HTML模板

 

分則必合。把大文件分片了,但是分片了就沒有原本文件功能,所以我們要把分片合成為原本的文件。我們只需要把分片按原本位置寫入到文件中去。因為前面原理那一部我們已經講到了,我們知道分塊大小和分塊序號,我就可以知道該分塊在文件中的起始位置。所以這里使用RandomAccessFile是明智的,RandomAccessFile能在文件里面前后移動。但是在andomAccessFile的絕大多數功能,已經被JDK1.4的NIO的“內存映射文件(memory-mapped files)”取代了。我在該項目中分別寫了使用RandomAccessFile與MappedByteBuffer來合成文件。分別對應的方法是uploadFileRandomAccessFile和uploadFileByMappedByteBuffer。兩個方法代碼如下。

秒傳功能

服務端邏輯

秒傳功能,相信大家都體現過了,網盤上傳的時候,發現上傳的文件秒傳了。其實原理稍微有研究過的同學應該知道,其實就是檢驗文件MD5,記錄下上傳到系統的文件的MD5,在一個文件上傳前先獲取文件內容MD5值或者部分取值MD5,然后在匹配系統上的數據。

Breakpoint-http實現秒傳原理,客戶端選擇文件之后,點擊上傳的時候觸發獲取文件MD5值,獲取MD5后調用系統一個接口(/index/checkFileMd5),查詢該MD5是否已經存在(我在該項目中用redis來存儲數據,用文件MD5值來作key,value是文件存儲的地址。)接口返回檢查狀態,然后再進行下一步的操作。相信大家看代碼就能明白了。

嗯,前端的MD5取值也是用了webuploader自帶的功能,這還是個不錯的工具。

控件計算完文件MD5后會觸發md5_complete事件,並傳值md5,開發者只需要處理這個事件即可,

 

斷點續傳

up6已經自動對斷點續傳進行了處理,不需要開發都再進行單獨的處理。

在f_post.jsp中接收這些參數,並進行處理,開發者只需要關注業務邏輯,不需要關注其它的方面。

 

斷點續傳,就是在文件上傳的過程中發生了中斷,人為因素(暫停)或者不可抗力(斷網或者網絡差)導致了文件上傳到一半失敗了。然后在環境恢復的時候,重新上傳該文件,而不至於是從新開始上傳的。

前面也已經講過,斷點續傳的功能是基於分塊上傳來實現的,把一個大文件分成很多個小塊,服務端能夠把每個上傳成功的分塊都落地下來,客戶端在上傳文件開始時調用接口快速驗證,條件選擇跳過某個分塊。

實現原理,就是在每個文件上傳前,就獲取到文件MD5取值,在上傳文件前調用接口(/index/checkFileMd5,沒錯也是秒傳的檢驗接口)如果獲取的文件狀態是未完成,則返回所有的還沒上傳的分塊的編號,然后前端進行條件篩算出哪些沒上傳的分塊,然后進行上傳。

當接收到文件塊后就可以直接寫入到服務器的文件中

這是文件夾上傳完后的效果

這是文件夾上傳完后在服務端的存儲結構

參考文章:http://blog.ncmem.com/wordpress/2019/08/12/java-http%E5%A4%A7%E6%96%87%E4%BB%B6%E6%96%AD%E7%82%B9%E7%BB%AD%E4%BC%A0%E4%B8%8A%E4%BC%A0/


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM