stata字元轉換,應對nonnumeric characters
04-07
將數據從excel複製或導入stata中經常會遇到字體紅色的情況,一般是因為數據非字元。運行destring,replace經常看到「xxxx contains nonnumeric characters; no replace」警告這種情況最好不要貿然運用destring加force等選項,這樣可能帶來數值扭曲。原本僅僅格式有問題的觀測值可能被軟體處理成缺失值等。
推薦閱讀:
最穩妥的方法是,檢驗到底那些數據是nonnumeric以及其特徵。
命令:tab var if regexm(var,"[^0-9.]")最常見的是發現觀測值中有空格如1 001,有奇怪符號如1?001,符號錯誤如"."被記錄成了","。這時候可以使用替換命令:replace var=subinstr(var,"待替換","替換",.)然後運行destring,replace(或其他選項)
注意:0.1.22之類的觀測值,往往不能被tab命令識別,這時候就要sort var,肉眼識別了。這種情況少見,一旦有,觀測值也不會太多,在edit模式下手工更正即可。推薦閱讀:
※Stata幫助和網路資源匯總(持續更新中)
※喜歡的姑娘在學stata 怎麼用stata來送一份與眾不同的生日禮物?
※Stata小抄:一組圖記住Stata常用命令
※Stata 15 dofile 和 .dta 文件轉碼方法
TAG:Stata |