1. ホーム
  2. r

[解決済み] R (...)は特異点のため定義されない

2022-02-11 07:24:58

質問

NA "の部分があるデータがあるのですが、どうしたらいいですか?完全なデータセットのサイズは1994 obsですが、「complete.cases」式を使っているので、control_datasetのサイズは319 obsです。

しかし、私はこのコードを開始しました。

zero_2nd <-lm(formula = ViolentCrimesPerPop ~ (population + householdsize + 
            racePctHisp + agePct12t29 + agePct65up + numbUrban + pctWWage + 
            pctWFarmSelf + pctWInvInc + pctWSocSec + medFamInc + perCapInc + 
            AsianPerCap + NumUnderPov + PctPopUnderPov + PctNotHSGrad + 
            PctBSorMore + PctUnemployed + PctEmploy + PctEmplManu + PctOccupManu + 
            PctOccupMgmtProf + TotalPctDiv + PctFam2Par + PctKids2Par + 
            PctYoungKids2Par + PctWorkMomYoungKids + NumImmig + PctImmigRecent + 
            PctImmigRec8 + PctImmigRec10 + PctRecentImmig + PctRecImmig8 + 
            PctRecImmig10 + PctSpeakEnglOnly + PctLargHouseFam + PctLargHouseOccup + 
            PersPerRentOccHous + PctPersDenseHous + PctHousLess3BR + 
            PctHousOwnOcc + PctWOFullPlumb + OwnOccMedVal + OwnOccHiQuart + 
            RentLowQ + MedRent + MedRentPctHousInc + MedOwnCostPctInc + 
            NumStreet + PctForeignBorn + LemasSwFTPerPop + LemasTotReqPerPop + 
            PolicPerPop + RacialMatchCommPol + PctPolicAsian + OfficAssgnDrugUnits + 
            PctUsePubTrans + PolicCars)^2, data = zerodata)

で、summary(zero_2nd)を使っています。 残差です。 319個の残差はすべて0:残差の自由度はない!?

係数です。(1393個は特異点のため未定義) が発生します。

であり、標準誤差、t値、Pr(>|t|)は全てNAである。

なぜこのような状況になったのか、どうすればこの問題を解決できるのか。

(ゼロデータ = カットされたデータセット (319 obs.))

どのように解決するのですか?

これはコーディングというより、統計的な質問です。基本的に、このようなエラーは、モデルで使用している共変量の1つが、別の共変量によって完全に予測されることを意味します。

詳しくは、以下のサイトをご覧ください。 Cross Validatedで同じような質問がありました。 .