標籤:

stata字元轉換,應對nonnumeric characters

將數據從excel複製或導入stata中經常會遇到字體紅色的情況,一般是因為數據非字元。運行destring,replace經常看到

「xxxx contains nonnumeric characters; no replace」警告

這種情況最好不要貿然運用destring加force等選項,這樣可能帶來數值扭曲。原本僅僅格式有問題的觀測值可能被軟體處理成缺失值等。

最穩妥的方法是,檢驗到底那些數據是nonnumeric以及其特徵。

命令:tab var if regexm(var,"[^0-9.]")

最常見的是發現觀測值中有空格如1 001,有奇怪符號如1?001,符號錯誤如"."被記錄成了","。

這時候可以使用替換命令:replace var=subinstr(var,"待替換","替換",.)

然後運行destring,replace(或其他選項)

注意:0.1.22之類的觀測值,往往不能被tab命令識別,這時候就要sort var,肉眼識別了。這種情況少見,一旦有,觀測值也不會太多,在edit模式下手工更正即可。
推薦閱讀:

Stata幫助和網路資源匯總(持續更新中)
喜歡的姑娘在學stata 怎麼用stata來送一份與眾不同的生日禮物?
Stata小抄:一組圖記住Stata常用命令
Stata 15 dofile 和 .dta 文件轉碼方法

TAG:Stata |