癌症新藥概念股的問題，透過圖書和論文來找解法和答案更準確安心。我們找到下列股價、配息、目標價等股票新聞資訊

國立聯合大學資訊管理學系碩士班馬麗菁所指導吳家豪的運用文字探勘於線上健康類新聞之分析與預測─巨量資料架構（2015），提出癌症新藥概念股關鍵因素是什麼，來自於文字探勘、商業智慧、巨量資料、健康新聞、預測。

運用文字探勘於線上健康類新聞之分析與預測─巨量資料架構

為了解決癌症新藥概念股的問題，作者吳家豪這樣論述：

近年來台灣受到食安風暴及環境污染等事件影響，健康議題常受到大眾的關注。因此，本研究針對線上健康類新聞的標題與內文，利用文字探勘技術，支援向量機、順序邏輯迴歸與決策樹三種預測方法，進行按讚數多寡的分析與預測，並分析四種不同的縮減概念維度與三種不同預測方法的組合，以找出預測正確率最高的組合，以預測新文章的按讚數多寡，並進一步以 Hadoop 為巨量資料平台，Spark為主要的平行運算框架，進行巨量資料預測與分析。研究結果顯示，按讚數較多的標題常包含疫苗防治與慢性病等議題的相關詞彙；而對於標題包含警語類與飲食類的新聞標題的按讚數較少；在預測方法上，以支援向量機搭配50縮減概念維度組合的預測正確率最

高。在巨量資料分析部份，實驗結果顯示，當資料筆數固定時，迭代次數越多，Spark的執行時間也會增長，但運算時間的增加幅度遠小於迭代次數的增加幅度；以不同Slave Nodes數量來看，2台Slave Nodes與3台Slave Nodes的運算時間差異不大，但與1台Slave Node相比，則有明顯的差異。而在不同資料筆數的測試中，資料量少的情況下，Slave Nodes數量影響執行時間的差異並不明顯，當資料量夠大時，在執行時間上就能看出有明顯的差異。本研究分析結果可供讀者及業者參考，業者亦可依據此分析與預測結果，篩選較受歡迎的健康新聞，或是將更多的資源投入在該類議題中，進一步吸引更多讀者上線

閱讀與回應；本研究的巨量資料架構規劃與分析結果，亦可供後續相關研究參考。

癌症新藥概念股的問題，透過圖書和論文來找解法和答案更準確安心。我們找到下列股價、配息、目標價等股票新聞資訊

接下來讓我們看這些論文和書籍都說些什麼吧：

除了癌症新藥概念股，大家也想知道這些：

運用文字探勘於線上健康類新聞之分析與預測─巨量資料架構

為了解決癌症新藥概念股的問題，作者吳家豪這樣論述：

分類

關於我們

相關站台

聯絡我們

癌症 新藥 概念股的問題，透過圖書和論文來找解法和答案更準確安心。 我們找到下列股價、配息、目標價等股票新聞資訊

接下來讓我們看這些論文和書籍都說些什麼吧：

除了癌症 新藥 概念股，大家也想知道這些：

運用文字探勘於線上健康類新聞之分析與預測─巨量資料架構

為了解決癌症 新藥 概念股的問題，作者吳家豪 這樣論述：

分類

癌症新藥概念股的問題，透過圖書和論文來找解法和答案更準確安心。我們找到下列股價、配息、目標價等股票新聞資訊

除了癌症新藥概念股，大家也想知道這些：

為了解決癌症新藥概念股的問題，作者吳家豪這樣論述：