ML.NET 0.10特性簡介


IDataView被單獨作為一個類庫包

IDataView組件為表格式數據提供了非常高效的處理方式,尤其是用於機器學習和高級分析應用。它被設計為可以高效地處理高維數據和大型數據集。並且也適合處理屬於更大的分布式數據集中的單個數據區塊結點。

在ML.NET 0.10中,IDataView被拆分成單個程序集和NuGet類庫包。這對於與其它API及框架交互是極重要的一步。

在被拆分后,其它的類庫將能直接引用它,而不需要引用整個ML.NET。這樣有助於第三方類庫也能使用IDataView所提供的強大功能。

場感知分解機訓練器支持多個特征列

在之前的ML.NET版本中,當使用場感知分解機(FFM)訓練器時,僅可以提供單個特征列。

在新的版本里,支持在Options參數里添加額外的特征列。

var ffmArgs = new FieldAwareFactorizationMachineTrainer.Options();

// Create the multiple field names.
ffmArgs.FeatureColumn = nameof(MyObservationClass.MyField1); // 首個字段
ffmArgs.ExtraFeatureColumns = new[]{ nameof(MyObservationClass.MyField2), nameof(MyObservationClass.MyField3) }; // 額外的字段

var pipeline = mlContext.BinaryClassification.Trainers.FieldAwareFactorizationMachine(ffmArgs);

var model = pipeline.Fit(dataView);

支持返回多個預測標簽

之前的版本里,即使預測多類別分類問題,也只能返回單一的標簽。

現在,這一缺陷終於被修復了。(其實在內部邏輯里已經對多項預測完成處理,但過去的API只返回了單一的結果)

源自社區的示例頁面

作為ML.NET Samples的一部分,現在新增了一個特殊頁面——由社區提供的多個示例。

里面有不少很好的例子:

照片查詢的WPF應用,其內部運行TensorFlow模型,並導出為ONNX格式。

使用ML.NET的UWP應用:

當然,歡迎有越來越多的貢獻者加入其中,提供更多的示例。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM