English  |  正體中文  |  简体中文  |  Items with full text/Total items : 2737/2828
Visitors : 341768      Online Users : 31
RC Version 4.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
Scope Adv. Search
LoginUploadHelpAboutAdminister

Please use this identifier to cite or link to this item: http://ir.lib.stu.edu.tw:80/ir/handle/310903100/1959

Title: 運用文件探勘技術進行新聞報導評價分類-以網路財經新聞為例
Classifying News Evaluation via Text Mining-A Case Study Based on Net Financial News
Authors: 馮雅民
Ya Min Feng
Contributors: 董信煌
資訊管理研究所
Keywords: 文字探勘;支持向量機;類神經網路;新聞評價;斷詞系統
Data Mining;Support Vector Machine;Backpropagation Neural Network
Date: 2007
Issue Date: 2011-05-26 11:07:20 (UTC+8)
Publisher: 高雄市:[樹德科技大學資訊管理研究所]
Abstract: 隨著網際網路的普及,使用者可以很便捷地經由網路找到他想要的資訊,在資訊爆炸時代,使用者也收到更多不是他想要的資訊,因此如何有效率管理來自網路的資訊也越來越重要,近幾年來有越來越多資料探勘技術運用在網際網路資料篩選上。
本研究使用文件探勘技術於YAHOO的網路中文財經新聞評價分類。新聞文件將透過中研院的斷詞系統切割成詞彙與切成個別字元做為資料維度,擷取關鍵詞並以向量模式來表現。在資訊獲利率被用來選擇合理的詞彙個數之後,本研究使用支持向量機(SVM)與類神經網路(ANN)二種不同的分類技術於財經新聞的報導評價。一件財經新聞報導將被歸類成正面、負面或中性等三種類別。實驗結果顯示,支持向量機與類神經網路有皆有60%以上的分辨正確率,其中以個別字元做為所擷取之關鍵詞正確率最高有67%,在實驗中支持向量機分類的正確率與模型的訓練速度皆優於較類神經網路。
網路財經新聞千變萬化,一則正面或負面的評價往往會造成一家企業在股票市場中的大漲或大跌。一般投資者或許是因為經驗或時間的因素,無法從大量的財經新聞報導中迅速與正確的替新聞評價做分類。本研究所建立的評價分類系統可使閱讀者在處理網路財經新聞時,增加評價分類的效率與正確性。
With prevalence of Internet, people can easily and quickly retrieve the information what they want from Internet. In Information explosion, users receive more information what they don’t want from internet. It is important how to manager information from Internet. Nearly several yeas, there is more and more the techniques of data mining used on the internet.
This research uses the technique of text mining usage in the finance and economics news of the YAHOO network. The news document is cut into a set of individual word through the word segment of Academia Sinica. After that, calculate the IDF and information gain of each word and choose several keyword from the set of news document by information gain. Those words will become the variable of the mining’s technique importation. This research uses SVM and BNN two kinds of mining technique and compares two kinds of accuracy for categorizing. SVM have bast precision rate and faster than BNN.
In the experiment, this research induces into the news category that has positive meaning or negative meaning through to the classification of the document and expecting can increase the finance and economics news sorting and read efficiency.
Appears in Collections:[資訊管理系(所)] 博碩士論文

Files in This Item:

File Description SizeFormat
運用文件探勘技術進行新聞報導評價分類-以網路財經新聞為例__臺灣博碩士論文知識加值系統.htm國圖111KbHTML674View/Open


All items in STUAIR are protected by copyright, with all rights reserved.

 


無標題文件

著作權政策宣告:

1.

本網站之數位內容為樹德科技大學所收錄之機構典藏,無償提供學術研究與公眾教育等公益性使用,惟仍請適度,合理使用本網站之內容,以尊重著作權人之權益。商業上之利用,則請先取得著作權人之授權。
 
2. 本網站之製作,已盡力防止侵害著作權人之權益,如仍發現本網站之數位內容有侵害著作權人權益情事者,請權利人通知本校護人員(clairhsu@stu.edu.tw),維護人員將立即採取移除該數位著作等補救措施。
 
DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - Feedback