散布図の最小二乗法及び最小絶対値方による線形回帰

Question

2 个投票

以下のプログラムでプロットした散布図を最小二乗法及び最小絶対値方、二つの方法で線形回帰したいのですが関数ありましたら教えて頂けると幸いです。どちらも各データセットごとではなくプロットした全ての値から線形回帰したいの考えています。

for i = 1:12
    hold on
    if i==1 || i==3 || i==5 || i==7 || i==8 || i==10 || i==12
        for j = 1:31
            xfilename = sprintf('TA2004%02d%02d.txt',i,j);
            yfilename = sprintf('TS2004%02d%02d.txt',i,j);
            x = load(xfilename);
            y = load(yfilename);
            if i==1 && j == 1
            scatter(x,y);
            else
            scatter(x,y);
            end
        end
    elseif i==2
        for j = 1:29
            xfilename = sprintf('TA2004%02d%02d.txt',i,j);
            yfilename = sprintf('TS2004%02d%02d.txt',i,j);
            x = load(xfilename);
            y = load(yfilename);
            scatter(x,y);
        end
    else
        for j = 1:30
            xfilename = sprintf('TA2004%02d%02d.txt',i,j);
            yfilename = sprintf('TS2004%02d%02d.txt',i,j);
            x = load(xfilename);
            y = load(yfilename);
            scatter(x,y);
        end        
    end
    hold off
end
xlabel('surface temperature');
ylabel('near-surface air temperature');

1 个评论
显示 -1更早的评论隐藏 -1更早的评论

Walter Roberson 2016-10-9

Approximate translation:

The method of least squares the scatter diagram plotted in the following program and the minimum absolute value hand, I want to linear regression in two ways, but I hope if you could tell me if you have a function. Both are thought to want to linear regression from all of the values plot rather than for each data set.

请先登录，再进行评论。

请先登录，再回答此问题。

请先登录再关注

Answer 1

michio 2016-10-10

编辑：michio 2016-10-10

在 MATLAB Online 中打开

1 个投票

最小二乗法での簡単な線形回帰は、多項式近似を行う polyfit が MATLAB 本体にありますが、最小絶対値法を使用して線形回帰を行う関数はありません。fminsearch関数などを使用して最適化問題としての実装が可能かと思います。

今回、コードから推察するに2004/1/1 から 2004/12/31 まで毎日観測した結果が保存された 366 x 2個のファイルから１つ１つデータを変数 x, y に読み込んで、散布図を作成されております。散布図の作成であれば１つ１つ処理すれば十分ですが、すべてのデータに対して線形回帰や相関係数を求める場合には、上記の方法では難しいかと思います。

以前、すべてのデータをメモリに読み込むことが可能かという点について質問させていただきましたが、732個のファイルからのすべてのデータの散布図を描けているようですので、メモリの面では問題が無いのかと推察します。

もし、R2014bより新しいバージョンのMATLABをご使用であれば、datastoreの使用をおすすめします: データストア入門。

実際にデータがどのように保存されているかによって多少のカスタマイズが必要ですが、

dsX = datastore('TA2004*.txt');
x = readall(dsX);
dsY = datastore('TS2004*.txt');
y = readall(dsY);

ですべてのデータファイルのデータを x, y に読み込むことができる関数です。

まずは、上記の datastore 関数の説明ページ、または下記のコマンドで挙動を確認してみてください。

dsX = datastore('TA2004*.txt')
preview(dsX)

15 个评论
显示 13更早的评论隐藏 13更早的评论

michio 2016-10-18

编辑：michio 2016-10-18

在 MATLAB Online 中打开

まず区切り文字が'スペース’と認識されていました。（区切り文字はデータを区切る文字列です。例：csvファイルの区切り文字はコンマ(,)) dsX のプロパティ Delimiter で確認できます。

また今回のテキストファイルの各行の先頭に２，３個の空白が存在します。結果、実際は値が入っていませんが、スペースで区切られた何かだと解釈され、NaNとして読み込まれています。これは MultipleDelimitersAsOne プロパティを true に変更することで対応できます。

他にも NumHeaderLines プロパティでファイルのヘッダー数を指定しますが、こちらが１２と認識されていますので、正しく0に変更が必要です。以上まとめまして、下記でご所望の処理になるかと思います。

dsX = datastore ('TS2004*.txt');
dsX.MultipleDelimitersAsOne = true;
dsX.NumHeaderLines = 0;
x = readall(dsX);
Mx = max(x.Var1);
Mm = min(x.Var1);
V = var(x.Var1);

それぞれのプロパティの詳細は先日記載しましたリンク先ページを参照ください。

summary(x)

michio 2016-10-29

在 MATLAB Online 中打开

以前と同じファイルですと、

 dsX = datastore ('TS2004*.txt');
 dsX.MultipleDelimitersAsOne = true;
 dsX.NumHeaderLines = 0;

のオプション設定が有効かと思います。 dsX (datastore object) の各プロパティとデータの形式、そして出力結果とをにらめっこしながら確認して頂くのが確実です。

経験上下記の５つは要注目です。

NumHeaderLines — ファイルの先頭でスキップする行数
Delimiter — フィールドの区切り記号
RowDelimiter — 行区切り記号文字
Whitespace — 空白文字
MultipleDelimitersAsOne — 複数の区切り記号の取り扱い

オプションも多く、それぞれ一つづつ確認するのは最初は大変かと思いますが、一度慣れていただきますとその他様々な形式のファイルに柔軟に対応できますので、是非一度挙動を確認してみてください。各オプション設定は

datastore: データの大規模な集合用のデータストアを作成

TabularTextDatastore のプロパティ

の２ページに例題も合わせて情報がありますので参考にしてください。

michio 2016-10-29

続きはこちら：see. https://jp.mathworks.com/matlabcentral/answers/309715-datastore

请先登录，再进行评论。

散布図の最小二乗法及び最小絶対値方による線形回帰

1 个评论
显示 -1更早的评论隐藏 -1更早的评论

回答（1 个）

15 个评论
显示 13更早的评论隐藏 13更早的评论

类别

产品

标签

Community Treasure Hunt

散布図の最小二乗法及び最小絶対値方による線形回帰

1 个评论 显示 -1更早的评论 隐藏 -1更早的评论

回答（1 个）

15 个评论 显示 13更早的评论 隐藏 13更早的评论

类别

产品

标签

另请参阅

Community Treasure Hunt

1 个评论
显示 -1更早的评论隐藏 -1更早的评论

15 个评论
显示 13更早的评论隐藏 13更早的评论