GOICE項目初探

本文轉載自查看原文 2016-05-14 21:11 1661 成功項目的簡單展示

GOICE項目初探

在圖像拼接方面，市面上能夠找到的軟件中，要數MS的ICE效果、魯棒性最好，而且界面也很美觀。應該說有很多值得學習的地方，雖然這個項目不開源，但是利用現有的資料，也可以實現很多具體的拼接工作。

基於現有的有限資源，主要是以opencv自己提供的stitch_detail進行修改和封包，基於ribbon編寫界面，我也嘗試實現了GOICE項目，實現全景圖片的拼接、橫向視頻的拼接，如果下一步有時間的話再將雙目實時拼接從以前的代碼中移植過來。

這里簡單地將一些技術要點進行解析，歡迎批評指正和合作交流！

一、對現有算法進行重新封裝

opencv原本的算法主要包含在 Stitching Pipeline中，結構相對比較復雜，具體可以查看opencv refman

對算法進行重構后整理如下：

 //使用變量
    Ptr<FeaturesFinder> finder;
    Mat full_img, img;
    int num_images = m_ImageList.size();
    vector<ImageFeatures> features(num_images);
    vector<Mat> images(num_images);
    vector<cv::Size> full_img_sizes(num_images);
    double seam_work_aspect = 1;
    vector<MatchesInfo> pairwise_matches;
    BestOf2NearestMatcher matcher(try_gpu, match_conf);
    vector<int> indices;
    vector<Mat> img_subset;
    vector<cv::Size> full_img_sizes_subset;
    HomographyBasedEstimator estimator;
    vector<CameraParams> cameras;
    vector<cv::Point> corners(num_images);
    vector<Mat> masks_warped(num_images);
    vector<Mat> images_warped(num_images);
    vector<cv::Size> sizes(num_images);
    vector<Mat> masks(num_images);
    Mat img_warped, img_warped_s;
    Mat dilated_mask, seam_mask, mask, mask_warped;
    Ptr<Blender> blender;
    double compose_work_aspect = 1;
 
    //拼接開始
    if (features_type == "surf")
        finder = new SurfFeaturesFinder();
    else
        finder = new OrbFeaturesFinder();
    
    //尋找特征點
    m_progress.SetPos(20);
    for (int i = 0; i < num_images; ++i)
    {
    
        full_img = m_ImageList[i].clone();
        full_img_sizes[i] = full_img.size();//讀到的是大小
        if (full_img.empty())
        {
            MessageBox("圖片讀取錯誤，請確認后重新嘗試!");
            return;
        }
        if (work_megapix < 0)
        {
            img = full_img;
            work_scale = 1;
            is_work_scale_set = true;
        }else{
            if (!is_work_scale_set)
            {
                work_scale = min(1.0, sqrt(work_megapix * 1e6 / full_img.size().area()));
                is_work_scale_set = true;
            }
            resize(full_img, img, cv::Size(), work_scale, work_scale);
        }
        if (!is_seam_scale_set)
        {
            seam_scale = min(1.0, sqrt(seam_megapix * 1e6 / full_img.size().area()));
            seam_work_aspect = seam_scale / work_scale;
            is_seam_scale_set = true;
        }
        (*finder)(img, features[i]);
        features[i].img_idx = i;
        resize(full_img, img, cv::Size(), seam_scale, seam_scale);
        images[i] = img.clone();
    }
 
    finder->collectGarbage();
    full_img.release();
    img.release();
    //進行匹配
    m_progress.SetPos(30);
    matcher(features, pairwise_matches);
    matcher.collectGarbage();
    indices  = leaveBiggestComponent(features, pairwise_matches, conf_thresh);
    for (size_t i = 0; i < indices.size(); ++i)
    {
        img_subset.push_back(images[indices[i]]);
        full_img_sizes_subset.push_back(full_img_sizes[indices[i]]);
    }
    m_progress.SetPos(40);
    images = img_subset;
 
    //判斷圖片是否足夠
    num_images = static_cast<int>(img_subset.size());
    if (num_images < 2)
    {
        MessageBox("圖片特征太少，嘗試添加更多圖片!");
        return;
    }
    estimator(features, pairwise_matches, cameras);
    for (size_t i = 0; i < cameras.size(); ++i)
    {
        Mat R;
        cameras[i].R.convertTo(R, CV_32F);
        cameras[i].R = R;
        //LOGLN("Initial intrinsics #" << indices[i]+1 << ":\n" << cameras[i].K());
    }
    //開始對准
    m_progress.SetPos(50);
    Ptr<detail::BundleAdjusterBase> adjuster;
    if (ba_cost_func == "reproj") adjuster = new detail::BundleAdjusterReproj();
    else 
    adjuster = new detail::BundleAdjusterRay();
    
    adjuster->setConfThresh(conf_thresh);
    Mat_<uchar> refine_mask = Mat::zeros(3, 3, CV_8U);
    if (ba_refine_mask[0] == 'x') refine_mask(0,0) = 1;
    if (ba_refine_mask[1] == 'x') refine_mask(0,1) = 1;
    if (ba_refine_mask[2] == 'x') refine_mask(0,2) = 1;
    if (ba_refine_mask[3] == 'x') refine_mask(1,1) = 1;
    if (ba_refine_mask[4] == 'x') refine_mask(1,2) = 1;
    adjuster->setRefinementMask(refine_mask);
    (*adjuster)(features, pairwise_matches, cameras);
 
    // Find median focal length
    vector<double> focals;
    for (size_t i = 0; i < cameras.size(); ++i)
        focals.push_back(cameras[i].focal);
    sort(focals.begin(), focals.end());
    float warped_image_scale;
    if (focals.size() % 2 == 1)
        warped_image_scale = static_cast<float>(focals[focals.size() / 2]);
    else
        warped_image_scale = static_cast<float>(focals[focals.size() / 2 - 1] + focals[focals.size() / 2]) * 0.5f;
    //開始融合
    m_progress.SetPos(60);
    if (do_wave_correct)
    {
        vector<Mat> rmats;
        for (size_t i = 0; i < cameras.size(); ++i)
            rmats.push_back(cameras[i].R);
        waveCorrect(rmats, wave_correct);
        for (size_t i = 0; i < cameras.size(); ++i)
            cameras[i].R = rmats[i];
    }
 
    //最后修正
    m_progress.SetPos(70);
    // Preapre images masks
    for (int i = 0; i < num_images; ++i)
    {
        masks[i].create(images[i].size(), CV_8U);
        masks[i].setTo(Scalar::all(255));
    }
    Ptr<WarperCreator> warper_creator;
    {
        if (warp_type == "plane") warper_creator = new cv::PlaneWarper();
        else if (warp_type == "cylindrical") warper_creator = new cv::CylindricalWarper();
        else if (warp_type == "spherical") warper_creator = new cv::SphericalWarper();
        else if (warp_type == "fisheye") warper_creator = new cv::FisheyeWarper();
        else if (warp_type == "stereographic") warper_creator = new cv::StereographicWarper();
        else if (warp_type == "compressedPlaneA2B1") warper_creator = new cv::CompressedRectilinearWarper(2, 1);
        else if (warp_type == "compressedPlaneA1.5B1") warper_creator = new cv::CompressedRectilinearWarper(1.5, 1);
        else if (warp_type == "compressedPlanePortraitA2B1") warper_creator = new cv::CompressedRectilinearPortraitWarper(2, 1);
        else if (warp_type == "compressedPlanePortraitA1.5B1") warper_creator = new cv::CompressedRectilinearPortraitWarper(1.5, 1);
        else if (warp_type == "paniniA2B1") warper_creator = new cv::PaniniWarper(2, 1);
        else if (warp_type == "paniniA1.5B1") warper_creator = new cv::PaniniWarper(1.5, 1);
        else if (warp_type == "paniniPortraitA2B1") warper_creator = new cv::PaniniPortraitWarper(2, 1);
        else if (warp_type == "paniniPortraitA1.5B1") warper_creator = new cv::PaniniPortraitWarper(1.5, 1);
        else if (warp_type == "mercator") warper_creator = new cv::MercatorWarper();
        else if (warp_type == "transverseMercator") warper_creator = new cv::TransverseMercatorWarper();
    }
    if (warper_creator.empty())
    {
        cout << "Can't create the following warper '" << warp_type << "'\n";
        return;}
 
    Ptr<RotationWarper> warper = warper_creator->create(static_cast<float>(warped_image_scale * seam_work_aspect));
 
    for (int i = 0; i < num_images; ++i)
    {
        Mat_<float> K;
        cameras[i].K().convertTo(K, CV_32F);
        float swa = (float)seam_work_aspect;
        K(0,0) *= swa; K(0,2) *= swa;
        K(1,1) *= swa; K(1,2) *= swa;
 
        corners[i] = warper->warp(images[i], K, cameras[i].R, INTER_LINEAR, BORDER_REFLECT, images_warped[i]);
        sizes[i] = images_warped[i].size();
 
        warper->warp(masks[i], K, cameras[i].R, INTER_NEAREST, BORDER_CONSTANT, masks_warped[i]);
    }
    vector<Mat> images_warped_f(num_images);
    for (int i = 0; i < num_images; ++i)
        images_warped[i].convertTo(images_warped_f[i], CV_32F);
    Ptr<ExposureCompensator> compensator = ExposureCompensator::createDefault(expos_comp_type);
    compensator->feed(corners, images_warped, masks_warped);
    //接縫修正
    m_progress.SetPos(80);
    Ptr<SeamFinder> seam_finder;
    if (seam_find_type == "no")
        seam_finder = new detail::NoSeamFinder();
    else if (seam_find_type == "voronoi")
        seam_finder = new detail::VoronoiSeamFinder();
    else if (seam_find_type == "gc_color")
        seam_finder = new detail::GraphCutSeamFinder(GraphCutSeamFinderBase::COST_COLOR);
    else if (seam_find_type == "gc_colorgrad")
        seam_finder = new detail::GraphCutSeamFinder(GraphCutSeamFinderBase::COST_COLOR_GRAD);
    else if (seam_find_type == "dp_color")
        seam_finder = new detail::DpSeamFinder(DpSeamFinder::COLOR);
    else if (seam_find_type == "dp_colorgrad")
        seam_finder = new detail::DpSeamFinder(DpSeamFinder::COLOR_GRAD);
    if (seam_finder.empty())
    {
        MessageBox("無法對圖像進行縫隙融合");
        return;
    }
    //輸出最后結果
    m_progress.SetPos(90);
    seam_finder->find(images_warped_f, corners, masks_warped);
    // Release unused memory
    images.clear();
    images_warped.clear();
    images_warped_f.clear();
    masks.clear();
 
    for (int img_idx = 0; img_idx < num_images; ++img_idx)
    {
        // Read image and resize it if necessary
        full_img = m_ImageList[img_idx];
        if (!is_compose_scale_set)
        {
            if (compose_megapix > 0)
                compose_scale = min(1.0, sqrt(compose_megapix * 1e6 / full_img.size().area()));
            is_compose_scale_set = true;
            // Compute relative scales
            compose_work_aspect = compose_scale / work_scale;
            // Update warped image scale
            warped_image_scale *= static_cast<float>(compose_work_aspect);
            warper = warper_creator->create(warped_image_scale);
            // Update corners and sizes
            for (int i = 0; i < num_images; ++i)
            {
                // Update intrinsics
                cameras[i].focal *= compose_work_aspect;
                cameras[i].ppx *= compose_work_aspect;
                cameras[i].ppy *= compose_work_aspect;
 
                // Update corner and size
                cv::Size sz = full_img_sizes[i];
                if (std::abs(compose_scale - 1) > 1e-1)
                {
                    sz.width = cvRound(full_img_sizes[i].width * compose_scale);
                    sz.height = cvRound(full_img_sizes[i].height * compose_scale);
                }
                Mat K;
                cameras[i].K().convertTo(K, CV_32F);
                cv::Rect roi = warper->warpRoi(sz, K, cameras[i].R);
                corners[i] = roi.tl();
                sizes[i] = roi.size();
            }
        }
        if (abs(compose_scale - 1) > 1e-1)
            resize(full_img, img, cv::Size(), compose_scale, compose_scale);
        else
            img = full_img;
        full_img.release();
        cv::Size img_size = img.size();
 
        Mat K;
        cameras[img_idx].K().convertTo(K, CV_32F);
 
        // Warp the current image
        warper->warp(img, K, cameras[img_idx].R, INTER_LINEAR, BORDER_REFLECT, img_warped);
 
        // Warp the current image mask
        mask.create(img_size, CV_8U);
        mask.setTo(Scalar::all(255));
        warper->warp(mask, K, cameras[img_idx].R, INTER_NEAREST, BORDER_CONSTANT, mask_warped);
 
        // Compensate exposure
        compensator->apply(img_idx, corners[img_idx], img_warped, mask_warped);
 
        img_warped.convertTo(img_warped_s, CV_16S);
        img_warped.release();
        img.release();
        mask.release();
 
        dilate(masks_warped[img_idx], dilated_mask, Mat());
        resize(dilated_mask, seam_mask, mask_warped.size());
        mask_warped = seam_mask & mask_warped;
 
        if (blender.empty())
        {
            blender = Blender::createDefault(blend_type, try_gpu);
            cv::Size dst_sz = resultRoi(corners, sizes).size();
            float blend_width = sqrt(static_cast<float>(dst_sz.area())) * blend_strength / 100.f;
            if (blend_width < 1.f)
                blender = Blender::createDefault(Blender::NO, try_gpu);
            else if (blend_type == Blender::MULTI_BAND)
            {
                MultiBandBlender* mb = dynamic_cast<MultiBandBlender*>(static_cast<Blender*>(blender));
                mb->setNumBands(static_cast<int>(ceil(log(blend_width)/log(2.)) - 1.));
                LOGLN("Multi-band blender, number of bands: " << mb->numBands());
            }
            else if (blend_type == Blender::FEATHER)
            {
                FeatherBlender* fb = dynamic_cast<FeatherBlender*>(static_cast<Blender*>(blender));
                fb->setSharpness(1.f/blend_width);
                LOGLN("Feather blender, sharpness: " << fb->sharpness());
            }
            blender->prepare(corners, sizes);
        }
 
        // Blend the current image
        blender->feed(img_warped_s, mask_warped, corners[img_idx]);
    }
    Mat result, result_mask;
    blender->blend(result, result_mask);
    m_progress.SetPos(100);
    AfxMessageBox("拼接成功!");
    m_progress.ShowWindow(false);
    m_progress.SetPos(0);
    //格式轉換
    result.convertTo(result,CV_8UC3);
    showImage(result,IDC_PBDST);
    //保存結果
    m_matResult = result.clone();

基本上沒有修改代碼的結構，但是做了幾個改變

1、原來的算法既讀取文件名，又保存mat變量，我這里將其統一成為使用vector<Mat>來進行保存；

2、將LOGLN的部分以messagebox的方式顯示出來，並且進行錯誤控制；

3、添加適當注釋，並且在合適的地方控制進度條顯示。

二、主要界面編寫技巧

主要界面使用了Ribbon的方法，結合使用 IconWorkshop生成圖標。如何生成這樣的圖片在我的博客中有專門介紹。

內容方面，使用了基於listctrl的縮略圖的顯示,具體參考我的另一篇blog--"圖像處理界面--縮略圖的顯示 "

三、視頻拼接的處理方法

相比較圖像拼接，這次添加了一個“橫向視頻”的拼接。其實算法原理是比較朴素的（當然這里考慮的是比較簡單的情況）。就是對於精心拍攝的視頻，那么只要每隔一段時間取一個圖片，然后把這些圖片進行拼接，就能夠得到視頻的全景圖片。

void CMFCApplication1View::OnButtonOpenmov()
{
    CString pathName; 
    CString szFilters= _T("*(*.*)|*.*|avi(*.avi)|*.avi|mp4(*.mp4)|*.mp4||");
    CFileDialog dlg(TRUE,NULL,NULL,NULL,szFilters,this);
    VideoCapture capture;
    Mat frame;
    int iFrameCount = 0;
    int iFram = 0;
    if(dlg.DoModal()==IDOK){
            //獲得路徑
            pathName=dlg.GetPathName(); 
            //設置窗體
            m_ListThumbnail.ShowWindow(false);
            m_imagerect.ShowWindow(false);
            m_imagedst.ShowWindow(true);
            m_progress.ShowWindow(false);
            m_msg.ShowWindow(false);
            //打開視頻並且抽取圖片
            capture.open((string)pathName);
            if (!capture.isOpened())
            {
                MessageBox("視頻打開錯誤！");
                return;
            }
            m_VectorMovImageNames.clear();
            m_MovImageList.clear();
            char cbuf[100];
            while (capture.read(frame))
            {
                //每隔50幀取一圖
                if (0 == iFram%50)
                {
                    m_MovImageList.push_back(frame.clone());
                }
                showImage(frame,IDC_PBDST);
                iFram = iFram +1;
            }
    }
}

四、反思和小結

1）雖然現在已經對opencv的算法進行了集成，但是由於算法原理還是繁瑣復雜的，下一步要結合對更復雜問題的進一步研究吃透算法；

2）使用ribbon進行程序設計現在已經比較熟悉了。能夠認識到工具擅長解決的問題、能夠認識到工具不好解決的問題，能夠快速實現，才算是掌握；

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 IDEA項目路徑初探 java初探（1）之秒殺項目總結 ExtJS初探：在項目中使用ExtJS Gradle初探（一）：創建一個Gradle項目 webpack練手項目之easySlide（一）：初探webpack 微軟牛津項目人臉識別API初探 Unity系列之項目開發環境初探 vueJs初探-創建第一個vue項目機器學習項目流程（一）初探數據集 vue初探（構建一個axios+java項目）