日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢(xún)
選擇下列產(chǎn)品馬上在線(xiàn)溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問(wèn)題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷(xiāo)解決方案
創(chuàng)新互聯(lián)AI教程:AI人工智能標(biāo)記數(shù)據(jù)

我們已經(jīng)知道,某種格式的數(shù)據(jù)對(duì)于機(jī)器學(xué)習(xí)算法是必需的。 另一個(gè)重要的要求是,在將數(shù)據(jù)作為機(jī)器學(xué)習(xí)算法的輸入發(fā)送之前,必須正確標(biāo)記數(shù)據(jù)。 例如,如果所說(shuō)的分類(lèi),那么數(shù)據(jù)上會(huì)有很多標(biāo)記。 這些標(biāo)記以文字,數(shù)字等形式存在。與 sklearn 中的機(jī)器學(xué)習(xí)相關(guān)的功能期望數(shù)據(jù)必須具有數(shù)字標(biāo)記。 因此,如果數(shù)據(jù)是其他形式,那么它必須轉(zhuǎn)換為數(shù)字。 這個(gè)將單詞標(biāo)簽轉(zhuǎn)換為數(shù)字形式的過(guò)程稱(chēng)為標(biāo)記編碼。

標(biāo)記編碼步驟

按照以下步驟在 Python 中對(duì)數(shù)據(jù)標(biāo)記進(jìn)行編碼 -

第1步 - 導(dǎo)入有用的軟件包

如果使用 Python,那么這將是將數(shù)據(jù)轉(zhuǎn)換為特定格式(即預(yù)處理)的第一步。 它可以做到如下 -

import numpy as np
from sklearn import preprocessing

第2步 - 定義樣本標(biāo)簽

導(dǎo)入包后,我們需要定義一些樣本標(biāo)簽,以便可以創(chuàng)建和訓(xùn)練標(biāo)簽編碼器。 現(xiàn)在將定義以下樣本標(biāo)簽 -

## Sample input labels
input_labels = ['red','black','red','green','black','yellow','white']

第3步 - 創(chuàng)建和訓(xùn)練標(biāo)簽編碼器對(duì)象

在這一步中,我們需要?jiǎng)?chuàng)建標(biāo)簽編碼器并對(duì)其進(jìn)行訓(xùn)練。 以下是 Python 代碼的實(shí)現(xiàn) -

## Creating the label encoder
encoder = preprocessing.LabelEncoder()
encoder.fit(input_labels)

以下是運(yùn)行上面的 Python 代碼后的輸出 -

LabelEncoder()

第4步 - 通過(guò)編碼隨機(jī)排序列表來(lái)檢查性能

此步驟可用于通過(guò)編碼隨機(jī)排序列表來(lái)檢查性能。 下面的 Python 代碼可以做同樣的事情 -

## encoding a set of labels
test_labels = ['green','red','black']
encoded_values = encoder.transform(test_labels)
print("\nLabels =", test_labels)

標(biāo)簽將如下打印 -

Labels = ['green', 'red', 'black']

現(xiàn)在,可以得到編碼值列表,即將文字標(biāo)簽轉(zhuǎn)換為數(shù)字,如下所示 -

print("Encoded values =", list(encoded_values))

輸出結(jié)果打印如下 -

Encoded values = [1, 2, 0]
Shell

第5步 - 通過(guò)解碼一組隨機(jī)數(shù)來(lái)檢查性能 -

通過(guò)對(duì)隨機(jī)數(shù)字集進(jìn)行解碼,可以使用此步驟來(lái)檢查性能。 下面的 Python 代碼也可以做同樣的事情 -

## decoding a set of values
encoded_values = [3,0,4,1]
decoded_list = encoder.inverse_transform(encoded_values)
print("\nEncoded values =", encoded_values)

現(xiàn)在,將被打印如下 -

Encoded values = [3, 0, 4, 1]
print("\nDecoded labels =", list(decoded_list))

現(xiàn)在,解碼值將被打印如下 -

Decoded labels = ['white', 'black', 'yellow', 'green']

標(biāo)記與未標(biāo)記數(shù)據(jù)

未標(biāo)記的數(shù)據(jù)主要由自然或人造物體的樣本組成,這些樣本可以很容易從現(xiàn)實(shí)世界中獲得。 它們包括音頻,視頻,照片,新聞文章等。

另一方面,帶標(biāo)簽的數(shù)據(jù)采用一組未標(biāo)記的數(shù)據(jù),并用一些有意義的標(biāo)簽或標(biāo)簽或類(lèi)來(lái)擴(kuò)充每片未標(biāo)記的數(shù)據(jù)。 例如,如果有照片,那么標(biāo)簽可以基于照片的內(nèi)容放置,即它是男孩或女孩或動(dòng)物或其他任何照片。 標(biāo)記數(shù)據(jù)需要人類(lèi)專(zhuān)業(yè)知識(shí)或判斷一個(gè)給定的未標(biāo)記數(shù)據(jù)。

有很多情況下,無(wú)標(biāo)簽數(shù)據(jù)豐富且容易獲得,但標(biāo)注數(shù)據(jù)通常需要人工/專(zhuān)家進(jìn)行注釋。 半監(jiān)督學(xué)習(xí)嘗試將標(biāo)記數(shù)據(jù)和未標(biāo)記數(shù)據(jù)組合起來(lái),以建立更好的模型。


網(wǎng)站題目:創(chuàng)新互聯(lián)AI教程:AI人工智能標(biāo)記數(shù)據(jù)
標(biāo)題鏈接:http://www.5511xx.com/article/djsjshi.html