IDataView被單獨作為一個類庫包
IDataView組件為表格式數據提供了非常高效的處理方式,尤其是用於機器學習和高級分析應用。它被設計為可以高效地處理高維數據和大型數據集。並且也適合處理屬於更大的分布式數據集中的單個數據區塊結點。
在ML.NET 0.10中,IDataView被拆分成單個程序集和NuGet類庫包。這對於與其它API及框架交互是極重要的一步。
在被拆分后,其它的類庫將能直接引用它,而不需要引用整個ML.NET。這樣有助於第三方類庫也能使用IDataView所提供的強大功能。
場感知分解機訓練器支持多個特征列
在之前的ML.NET版本中,當使用場感知分解機(FFM)訓練器時,僅可以提供單個特征列。
在新的版本里,支持在Options參數里添加額外的特征列。
var ffmArgs = new FieldAwareFactorizationMachineTrainer.Options();
// Create the multiple field names.
ffmArgs.FeatureColumn = nameof(MyObservationClass.MyField1); // 首個字段
ffmArgs.ExtraFeatureColumns = new[]{ nameof(MyObservationClass.MyField2), nameof(MyObservationClass.MyField3) }; // 額外的字段
var pipeline = mlContext.BinaryClassification.Trainers.FieldAwareFactorizationMachine(ffmArgs);
var model = pipeline.Fit(dataView);
支持返回多個預測標簽
之前的版本里,即使預測多類別分類問題,也只能返回單一的標簽。
現在,這一缺陷終於被修復了。(其實在內部邏輯里已經對多項預測完成處理,但過去的API只返回了單一的結果)
源自社區的示例頁面
作為ML.NET Samples的一部分,現在新增了一個特殊頁面——由社區提供的多個示例。
里面有不少很好的例子:
照片查詢的WPF應用,其內部運行TensorFlow模型,並導出為ONNX格式。
使用ML.NET的UWP應用:
當然,歡迎有越來越多的貢獻者加入其中,提供更多的示例。