反傾銷預警系統中的數據挖掘技術
黃勇 邱望仁 段金華
[摘 要] 本文從反傾銷預警內涵入手,指出其核心所在,并在此基礎上,較為詳盡地論述了如何運用數據挖掘技術對無序的和表層的反傾銷預警構成數據進行運算與推斷,旨在為國家有關部門構建反傾銷預警系統提供一種新思路。
[關鍵詞] 反傾銷;預警系統;數據挖掘
近20年來,經濟全球化使世界各國、各地區之間經濟相互依賴程度日益加深,貿易保護主義抬頭,貿易紛爭日益激烈,作為GATT/WTO法律體系重要組成部分的反傾銷規則,正在為世貿組織各成員越來越頻繁地使用。中國作為世界上最大的發展中國家和主要貿易大國,從1995年至今,己經連續12年成為遭受反傾銷最多的國家,見表。
面對國外接踵而來的反傾銷,建立出口預警機制,即利用數據挖掘技術將具體商品和市場進行分級分類,提出分級預警防范和應對措施,以引導企業有序出口,是應對來自國外反傾銷的當務之急。
一、 反傾銷預警
目前,國內對反傾銷預警有兩種理解。一種是以進口國為發起方,將“反傾銷預警”理解為反對別國在本國傾銷的預警;另一種是以出口國為發起方,將“反傾銷預警”理解為對別國向本國發起的反傾銷的預警。前后二者實施主體可能同一,但扮演的角色卻不同。本文將站在出口國的角度給予研判。即我們認為,反傾銷預警是指一國以出口國的身份,以WTO相關規則和出口國家相關法律、法規為依據,運用經濟學原理、研究方法和信息技術手段,通過采集各國海關數據、政府或行業協會發展預測數據,跟蹤各國各類貿易救濟措施潛在信息,向本國政府、企業、行業協會和專業服務機構提供預警服務,包括國內產業產銷量、產能變化、技術進步及生產企業生產經營狀況變化信息,國內市場價格信息、本國出口到各國產品數量和價格走勢、產品傾銷幅度、產業損害程度等,通過對國內產品整體出口情況進行監控,及時發現和制止不正當出口競爭,為避免遭受國外反傾銷等指控提供支撐。
基于上述分析,不難看出,反傾銷預警的核心在于能否通過對重點、敏感產品的出口數量、價格以及國外同類產品生產經營情況等重要參數變化的監測,準確地研判出對進口方產業的影響,以及其受到實質性損害(威脅)程度或阻礙產業建立程度的預警信息。
二、數據挖掘技術
數據挖掘(Data mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。挖掘出的知識通常被表示為概念、規則、規律、模式、約束或可視化等形式,用以輔助決策過程或修正已有的知識體系。
1.數據挖掘的功能
數據挖掘的功能常分可成5類:關聯分析、概括分析、分類分析、聚類分析、預測與評價。(1)關聯分析,即利用關聯規則進行數據挖掘。分析表面上不相關數據之間的內在聯系,揭示各事件之間的依賴性和相關性,分析范圍包括簡單關聯、因果關聯等。(2)概括分析,即提取數據庫中指定的數據集合的一般特性,找出普遍性規律。(3)分類分析,設置分類規則,把各個事務或實體按照性質和特征的不同進行歸類訓練,把數據層次化和規整化,從而建立數據的分類模型,對于沒有分類的數據進行分類。(4)聚類分析,聚類是對記錄分組,把相似的記錄歸在一個聚集里,是通過分析和歸納實體之間的特征差異,選出具有相同特征的實體聚合成為一個類,并用某種規則來描述該類的相同屬性,形成一種聚類規則。(5)預測與評價,對歷史數據進行綜合分析和歸納,推理出數據分布的時效性和規律性,從而對未來事件發展的趨勢和結果進行預測和評估,這種預測是需要時間來驗證的。
2.數據挖掘的過程
數據挖掘一般由三個階段組成:數據準備、數據挖掘、結果的表達和驗證。數據準備是指先明確數據挖掘的對象和商業應用主題,再針對商業主題收集數據源,并對數據做整理和轉換等技術處理,最后裝進數據倉庫。數據挖掘是創建正確的數據挖掘模型,并選擇合適的挖掘算法,從數據集合中析取有價值的商業知識,例如商業規則、營銷模式、帶來最多利潤的顧客群分布模型、顧客購買的商品之間的關聯程度等等。結果的表達和驗證是在原始數據經過挖掘算法處理之后,將產生一系列有價值的結果,必須用簡單易懂的語言或圖表把它表達出來,并集成到電子商務中心,融合專家知識與領域規則,為商業活動提供決策支持,并在商業實踐中來檢驗它。
3.數據挖掘的方法
數據挖掘的方法,可粗分為:統計方法、機器學習方法、神經網絡方法和數據庫方法。統計方法可細分為:回歸分析、判別分析、聚類分析、探索性分析以及模糊集、粗糙集、支持向量集等。機器學習可細分為:歸納學習方法、基于范例的推理CBR、遺傳算法、貝葉斯信念網絡等。神經網絡方法可細分為:前向神經網絡、自組織神經網絡等。其中,模糊和粗糙集方法已經被廣泛地應用在各行業中了。如:用基于粗糙集——主成分分析方法進行企業創新能力評價,用模糊邏輯規則進行企業生產決策,用模糊算法進行供應鏈合作伙伴的選擇,利用遺傳算法實現客戶關系的管理,等等。
三、數據挖掘技術在反傾銷預警系統中的應用
在反傾銷預警系統中的數據挖掘就是從大量的有關產業出口企業資料信息庫以及Web的數據中,收集產品的出口數量、價格以及國外同類產品生產經營情況、產業政策等重要參數變化信息,然后借助各種分析方法,透過無序的、表層的信息挖出內在的知識和規律,系統就可以根據這些規律或用這些信息設計數學模型,對未發生行為做出結果分析和預測,并及時發布給相關企業,從而為企業的綜合經營決策、市場策劃提供依據。具體來說,就是根據WTO《反傾銷協議》對傾銷的認定條件規定,運用數據挖掘技術對無序的和表層的反傾銷預警構成數據,進行運算與推斷,研判出口價格、出口數量及增率是否正常,對進口國有無實質性損害或損害威脅,甚至阻礙其產業建立。因此,數據挖掘技術在反傾銷預警系統中的應用具體反映在數據挖掘技術在出口產品價格動態分析預警系統、出口產品數量動態分析預警系統以及損害動態分析預警系統等三個預警系統中的應用。
1.出口產品價格動態分析預警系統
根據WTO《反傾銷協議》對傾銷的認定條件規定,產品以低于正常價值向另一國銷售,即存在傾銷產品。因此,出口產品價格動態分析預警系統主要功能是通過產品價格監控系統,動態跟蹤出口產品價格,并根據正常價格,檢測其波動幅度,進而預測產品出口價格是否正常。為此,其程序設計的基本思路是:根據出口產品的正常價值(成本+合理費用+合理利潤)并結合進口國對該產品反傾銷的歷史數據確定出該產品正常區間值[a,b],即“綠色安全區域”。如果出口產品價格低于“綠色安全區域”上限a這一閥值,一旦出口數量增長超過一定量,隨時將可能會被進口國廠商或政府提起反傾銷訴訟。此時,系統會給出預警,并根據其差距給出不同信號。如處于[0.85a,a]區間,則給出“黃色”信號。該數值范圍就是“黃色反傾銷區域”;處于[0.65a,0.85a]區間,則給出“橙色”信號。該數值范圍就是“橙色反傾銷區域”;處于[0,0.65a]區間,則給出“紅色”信號。該數值范圍就是“紅色反傾銷區域”。無論何種預警信號出現,行業協會應對出口該產品的企業進行有關信息通報,以便企業作出合理的決策;當預警信號處于“橙色”以上,行業協會必須出面協調相關出口企業,對出口到該國產品進行一定的限制,否則出口企業將會招致被訴“傾銷”,如圖所示。如果出口產品價格高于“綠色安全區域”下限b這一閥值,預示著該產品出口價格相對過高,即意味著在某一國外市場上本國還有降價銷售空間。
通過上述分析,不難看出,出口價格的確定十分關鍵。然而,出口產品價格的確定相當復雜,各個國家規定的確定方法也不相同。所以,這方面的數據構成應當嚴格根據本國和它國的相關規定,確定數據的考慮范圍和內容。常通過收集大量國內外的同行業、相同產品的時點價格動態信息及綜合性價格信息,建立起產品價格監控系統。即可以通過運用數據挖掘的概念描述,從出口反傾銷數據信息系統(海關報關系統)中選定特定行業及其中某一產品,并運用分類分析法和聚類分析法從中析取該類產品單個企業出口時點價格動態信息及綜合性價格信息,全國出口平均時點價格動態信息及綜合性價格信息,進口國的時點價格動態信息及綜合性價格信息,其他國家出口到該進口國的時點價格動態信息及綜合性價格信息等。在對以上數據進行分類和聚類的基礎上,確定出正常的價值,并運用偏差檢測法計算產品價格偏差度。
2.出口產品數量動態分析預警系統
根據WTO《反傾銷協議》對傾銷的認定條件規定,銷售量在一段時間內猛增是裁定某類產品是否構成傾銷的條件之一。因此,必須構建出口產品數量動態分析預警系統,用以動態跟蹤出口產品數量及其變化,并根據反傾銷歷史數據研判其增幅是否正常。其工作原理是:通過數據挖掘技術中的概念描述,從出口反傾銷數據信息系統(海關報關系統)中選定特定行業及其中某一產品,并運用分類分析法和聚類分析法從中析取該類產品出口地、出口的數量、在進口國所占的市場份額等相關的時點數據及綜合性數據、進口國相同產品的國內生產量、國內產品銷售量或市場份額及其他國家在該國同類產品的出口數量等相關的時點數據及綜合性數據等信息到出口產品數量監控系統中。系統再定時調用相應模型,通過匯總、分類等方法對本國企業出口產品數量信息庫中的出口到同一國家的商品數據進行動態分析、比較,并結合反傾銷歷史數據,按一定規律將本國出口到它國商品數量區分為紅、黃、綠三個區域。其中:(1)“綠色安全區域”,表示出口產品數量及其變化處于正常值的范圍,也意味著在某一國外市場上本國還有出口空間。(2)“紅色反傾銷區域”,則表示出口產品在進口國的出口銷售量及市場占有率達到一般會被進口國廠商或政府提起反傾銷訴訟的范圍。一旦出口產品價格低于正常的價格,即隨時會被外國政府反傾銷。行業協會必須對相關出口企業出口該產品數量進行協調,對出口到該國產品的出口價格進行一定的限制,否則出口企業將會招致被訴“傾銷”。(3)“黃色警示區域”,則處于“綠色安全區域”和“紅色反傾銷區域”之間,表示產品出口量或增量已超過正常值的范圍,可能會導致國外政府反傾銷。此時,行業協會必須對出口該產品的企業進行有關信息通報,以便企業作出合理的決策。
3.損害動態分析預警系統
根據世貿組織的規定,確定實質性損害威脅有以下幾個條件:(1)傾銷進口產品以極大的增長速度進入進口國市場;(2)出口商有能力擴大生產、增加出口,或者出口商有大量庫存產品可以出口;(3)傾銷產品的出口價格是否會打擊國內產品價格;(4)進口國尚有新的市場可以吸收擴大的傾銷出口產品。所以,確定實質損害應考慮出口產品的數量對進口國相同產品價格和產品生產商造成的影響,它主要依賴于出口國產品傾銷的輸入量、傾銷輸入對價格的影響、對進口國同種產品國內生產價格的影響,但在規則中使用了模糊概念、傾銷輸入量有相當程度增加對進口國國內價格有相當程度壓制等,使得損害的確定極具主觀性。
由于損害的確定極具主觀性,預警系統的設置應當經過系統全面的調查分析,設計出了一個完整的產業損害指標體系,可以用層次分析法同灰色評判模型,或者同模糊理論相結合,對產業損害程度進行綜合考慮。同時根據行業和企業的特點選取不同的損害評價指標,確定出它們的權重。并運用經濟學中的彈性概念確定傾銷對國內產業的影響、運用單層次模糊綜合評判方法進行損害分析,以提供預警依據。
四、結論
加入WTO后,我國出口產品越來越多地遭到反傾銷調查和起訴。這些都是企業在決策時不得不面對的情況。在嚴峻的形勢下,我們應當在構筑由政府、中介組織和企業共同組成的反傾銷應訴體系的基礎上, 立足于數據挖掘這一數據庫和信息決策領域的理論前沿,通過構造更為先進的數據采集和處理模型,從多種信息源中提取出高質量的、及時的信息,建立一個完善、科學、準確的反傾銷預警系統,以應對新時期市場對企業的挑戰,為企業的戰略決策提供有力的、科學的依據,保證企業的可持續和諧發展。
[1]邵峰晶,等.數據挖掘原理與算法[M].北京:中國水利水電出版社,2003.
[2]康塔尼克,著.閃四清,等譯.數據挖掘:概念、模型、方法和算法[M].北京:清華大學出版社,2003.
[3]易久.電子商務中數據挖掘技術的應用[J].工業技術經濟,2004,(4).
[4]李峰.數據挖掘在企業中的應用[J].商場現代化·商業技術,2004,(12).
[5]劉君強,等.數據挖掘技術在企業經營中的應用研究[J].商業經濟與管理,2003,(6).
[6]吳宗朝,張玉峰.企業競爭情報獲取途徑的分析[J].情報雜志,2007,(2).