日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關咨詢
選擇下列產品馬上在線溝通
服務時間:8:30-17:00
你可能遇到了下面的問題
關閉右側工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
創(chuàng)新互聯(lián)Python教程:python中PCA的處理過程

1、輸入矩陣歸一化處理。

2、計算樣本協(xié)方差矩陣。

3、求解協(xié)方差矩陣指定的特征值對應特征向量。

4、確定轉換矩陣,求解降維數(shù)據(jù)。

實例

#/usr/nom/env python
# _*_coding:utf-8_*_
# @Time      :2021/9/3 10:04
# @Author    :A bigfish
# @FileName  :maindemo13.py
# @Software  :PyCharm
 
import matplotlib.pyplot as plt
import numpy as np
from pylab import *
 
# 首先導入數(shù)據(jù),此部分為從存儲列表或單元中讀取分析數(shù)據(jù)
def loadDataSet(filename, delim='\t'):    #此處的'\t'表示不同變量間的分隔符,t表示tab鍵鍵入的空格
    fr = open(filename)
    stringArr = [line.strip().split(delim) for line in fr.readlines()]
    dataArr = [list(map(float, line)) for line in stringArr]
    return np.mat(dataArr)
 
 
# 定義PCA分析函數(shù)
def pca(dataset, topNfeat = 99999):        #topNfeat特征值數(shù)目,通常不用設置,因為后續(xù)要進行可視化分析                
    meanVals = np.mean(dataset, axis=0)    #求均值
    meanRemoved = dataset - meanVals       #預處理
    covMat = np.cov(meanRemoved, rowvar=0) #求解輸入數(shù)據(jù)協(xié)方差矩陣
    eigVals, eigVects = np.linalg.eig(np.mat(covMat))    #求解特征值,特征向量
    eigVaInd = np.argsort(eigVals)         #對特征值進行排序處理,默認為升序
    eigVaInd = eigVaInd[-1:-(topNfeat):-1] #根據(jù)指定數(shù)目進行逆序處理
    redEigVects = eigVects[:,eigVaInd]     #選取對應特征向量
    lowDataMat = meanRemoved * redEigVects #數(shù)據(jù)降維X*P
    recontMat = (lowDataMat * redEigVects.T) + meanVals #c處理進行了數(shù)據(jù)重構,非必須選項
    return lowDataMat, recontMat, eigVals  #返回數(shù)據(jù)
 
# 定義特值值繪制函數(shù)
def plotEig(dataset, numFeat=20):            
    mpl.rcParams['font.sans-serif'] = ['Times NewRoman']
    sumData = np.zeros((1, numFeat))
    dataset = dataset / sum(dataset)
    for i in range(numFeat):
        sumData[0, i] = sum(dataset[0:i])
 
    X = np.linspace(1, numFeat, numFeat)
    fig = plt.figure()
    ax = fig.add_subplot(211)
    ax.plot(X, (sumData*100).T, 'r-+')
    mpl.rcParams['font.sans-serif'] = ['SimHei']
    plt.ylabel('累計方差百分比')
 
    ax2 = fig.add_subplot(212)
    ax2.plot(X.T, (dataset[0:numFeat].T)*100, 'b-*')
    plt.xlabel('主成分數(shù)')
    plt.ylabel('方差百分比')
    plt.show()
 
# 定義原始數(shù)據(jù)及第一主成分繪制函數(shù)
def plotData(OrigData, recData):
    import matplotlib.pyplot as plt
    fig = plt.figure()
    ax = fig.add_subplot(111)
    ax.scatter(OrigData[:,0].flatten().A[0], OrigData[:, 1].flatten().A[0], c='blue',marker='^', s=90)
    ax.scatter(recData[:, 0].flatten().A[0], recData[:, 1].flatten().A[0], c='red', marker='o',s=90)
plt.show()

以上就是python中PCA的處理過程,希望對大家有所幫助。更多Python學習指路:創(chuàng)新互聯(lián)python教程

本文教程操作環(huán)境:windows7系統(tǒng)、Python 3.9.1,DELL G3電腦。


名稱欄目:創(chuàng)新互聯(lián)Python教程:python中PCA的處理過程
文章起源:http://www.5511xx.com/article/djdcssd.html