癌症 新藥 概念股的問題,透過圖書和論文來找解法和答案更準確安心。 我們找到下列股價、配息、目標價等股票新聞資訊

國立聯合大學 資訊管理學系碩士班 馬麗菁所指導 吳家豪的 運用文字探勘於線上健康類新聞之分析與預測─巨量資料架構 (2015),提出癌症 新藥 概念股關鍵因素是什麼,來自於文字探勘、商業智慧、巨量資料、健康新聞、預測。

接下來讓我們看這些論文和書籍都說些什麼吧:

除了癌症 新藥 概念股,大家也想知道這些:

運用文字探勘於線上健康類新聞之分析與預測─巨量資料架構

為了解決癌症 新藥 概念股的問題,作者吳家豪 這樣論述:

近年來台灣受到食安風暴及環境污染等事件影響,健康議題常受到大眾的關注。因此,本研究針對線上健康類新聞的標題與內文,利用文字探勘技術,支援向量機、順序邏輯迴歸與決策樹三種預測方法,進行按讚數多寡的分析與預測,並分析四種不同的縮減概念維度與三種不同預測方法的組合,以找出預測正確率最高的組合,以預測新文章的按讚數多寡,並進一步以 Hadoop 為巨量資料平台,Spark為主要的平行運算框架,進行巨量資料預測與分析。研究結果顯示,按讚數較多的標題常包含疫苗防治與慢性病等議題的相關詞彙;而對於標題包含警語類與飲食類的新聞標題的按讚數較少;在預測方法上,以支援向量機搭配50縮減概念維度組合的預測正確率最

高。在巨量資料分析部份,實驗結果顯示,當資料筆數固定時,迭代次數越多,Spark的執行時間也會增長,但運算時間的增加幅度遠小於迭代次數的增加幅度;以不同Slave Nodes數量來看,2台Slave Nodes與3台Slave Nodes的運算時間差異不大,但與1台Slave Node相比,則有明顯的差異。而在不同資料筆數的測試中,資料量少的情況下,Slave Nodes數量影響執行時間的差異並不明顯,當資料量夠大時,在執行時間上就能看出有明顯的差異。本研究分析結果可供讀者及業者參考,業者亦可依據此分析與預測結果,篩選較受歡迎的健康新聞,或是將更多的資源投入在該類議題中,進一步吸引更多讀者上線

閱讀與回應;本研究的巨量資料架構規劃與分析結果,亦可供後續相關研究參考。