① 中國工業企業資料庫怎麼獲取
中國工業企業數據已成為國內外學者研究中國企業行為和績效的主要數據之一,但是這個資料庫處理起來並不容易。在正式開始之前,我們必須清楚兩個概念:
1、脫敏數據:所謂脫敏之後的工業企業數據,就是指這份工業企業數據每個企業的名稱、地址、電話等敏感信息已經剔除;
2、序貫匹配:將不同年份的未脫敏數據合並為一份面板數據時,需要每家企業具有唯一的企業標識碼,序貫匹配的方法可以為每家企業生成唯一的標識碼(除序貫匹配外還有聶輝華(2012)交叉匹配法,本文主要以序貫匹配法為例);
有了上述兩個概念之後,就可以將我們獲取的工業企業數據分為以下三種類型:
1、經過序貫匹配之後的未脫敏數據
2、經過序貫匹配之後的脫敏數據
3、未經過序貫匹配的未脫敏數據
首先是 經過序貫匹配之後的未脫敏數據(獲取這類數據的渠道包括:EPS、中國工業企業數據查詢系統),這一類型的數據未脫敏,因此可以與污染、創新、海關等資料庫匹配使用,但由於數據商並沒有提供序貫匹配的代碼和詳細方法,因此序貫匹配過程是一個黑洞;
其次是 經過序貫匹配之後的脫敏數據( 獲取這類數據的渠道包括:RESSET),這一類型的數據脫敏,因此不可以與其他資料庫匹配使用,並且序貫匹配過程是一個黑洞;
最後是 未經過序貫匹配的未脫敏數據(獲取這類數據的渠道包括:不詳 高校老師可能有),這一類型的數據未脫敏,因此可以與其他資料庫匹配使用,並且這一類型數據並沒有經過序貫匹配的方法為每家企業生成唯一的標識碼,因此可以自己參考Brandt et al.(2012)等方法進行匹配,避免序貫匹配過程的黑洞;
② 中國工業企業資料庫中法人代碼是什麼意思
就是組織代碼,是企業法人的唯一編碼,
類似人的身份證號碼。