Matlab剔除多变量异常数据,异常数据用0代替。
MATLAB剔除异常数据,对异常数据用0代替的方法采用统计识别法,根据统计学规律给定一个置信概率,并确定置信限,然后采用拉以达准则进行异常值踢除,这里对异常值赋值为0。下面是具体程序和方法步骤。
操作方法
- 01
首先将样本数据读入到wt矩阵。 程序如下: wt=xlsread('样本数据.xlsx'); %读入样本数据表格 可以打开工作区的变量表查看是否已经读入数据,下面正常读入了数据。
- 02
接着计算样本数据的大小 n行 p列 [n,p]=size(wt); 运行结果如下图所示。
- 03
再依次将样本数据表中变量一列一列赋值给c_wt,计算平均值,当前值减去平均值(样本数据偏差),计算标准差, 当前值减去平均值(样本数据偏差)的绝对值,与3倍标准差比较,若大于则代表数据异常,将异常值赋值为0,将剔除异常数据后的变量依次一列一列填入ty_wt。 程序代码如下: for c=1:p c_wt=wt(:,c); %依次将样本数据表中变量一列一列赋值给c_wt c_wtmean=mean(c_wt); %计算平均值 j=1; for i=1:n vi(i,:)=c_wt(i,:)-c_wtmean; % 当前值减去平均值(样本数据偏差) stdcwt=std(c_wt); % 计算标准差 if abs(vi(i,:))>3*stdcwt % 当前值减去平均值(样本数据偏差)的绝对值与3倍标准差比较,若大于则代表数据异常,执行if后面语句 c_wt(i,:)=0; % 将异常值赋值为0 c_tbj(j,c)=i; %标记异常数据的坐标 j=j+1; end end ty_wt(:,c) = c_wt; %将剔除异常数据后的变量依次一列一列填入ty_wt end 运行结果如下图所示。
- 04
然后将剔除异常后数据ty_wt写入到剔除异常后数据Excel表格。 程序如下: xlswrite('剔除异常后数据.xlsx',ty_wt); 运行结果如下图所示。
- 05
完整程序代码及截图如下: %*******剔除异常数据,对异常数据用0代替。******************************* %**********采用统计识别法,根据统计学规律给定一个置信概率,并确定置信限,采用拉以达准则****************** wt=xlsread('样本数据.xlsx'); %读入样本数据 [n,p]=size(wt); %求样本数据的大小 n行,p列 for c=1:p c_wt=wt(:,c); %依次将样本数据表中变量一列一列赋值给c_wt c_wtmean=mean(c_wt); %计算平均值 j=1; for i=1:n vi(i,:)=c_wt(i,:)-c_wtmean; % 当前值减去平均值(样本数据偏差) stdcwt=std(c_wt); % 计算标准差 if abs(vi(i,:))>3*stdcwt % 当前值减去平均值(样本数据偏差)的绝对值与3倍标准差比较,若大于则代表数据异常,执行if后面语句 c_wt(i,:)=0; % 将异常值赋值为0 c_tbj(j,c)=i; %标记异常数据的坐标 j=j+1; end end ty_wt(:,c) = c_wt; %将提出异常数据后的变量依次一列一列填入ty_wt end xlswrite('剔除异常后数据.xlsx',ty_wt); % 将剔除异常后数据ty_wt赋值给剔除异常后数据表格 %**************************************************************************