當采集中的url包含%2F時


請的一次信息抓取的時候,URI中包含%2F,但在URI雖包含的%2F的都轉成/,如web.com/%2F 顯示的是web//,導致地址出錯。有時候如worda%2Fwordb,代表一個關鍵詞,而轉換后worda/wordb,成目錄了,2次編碼也能解決,,很顯然,URI把地址給轉換或者說是標准化了,但有時候卻不對,具說之方法是作者在stackoverflow中找到解方法的。

解決方法:

static void ForceCanonicalPathAndQuery(Uri uri)

{

string paq = uri.PathAndQuery; // need to access PathAndQuery

FieldInfo flagsFieldInfo = typeof(Uri).GetField("m_Flags", BindingFlags.Instance | BindingFlags.NonPublic);

ulong flags = (ulong)flagsFieldInfo.GetValue(uri);

flags &= ~((ulong)0x30); // Flags.PathNotCanonical|Flags.QueryNotCanonical

flagsFieldInfo.SetValue(uri, flags);

}

調試:

Uri uri = new Uri("xxx.com/%2F");
ForceCanonicalPathAndQuery(uri);

 

希望有其它方法...


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM