期末進度報告HW3

營建工程系管理組: M99o5115林俊錡

 

流程架構

 

 

探討問題1

l   因為檔案最大有達到500M,但是我們要在匯入資料庫前要先將文字轉換成EXCEL的格式,所以我們利用C語言,將檔案進行切割。

描述: 描述: 未命名.bmp

 

探討問題2

l   因為檔案太多,所以我們無法全部匯入WEKA,所以我們把資料匯入MSSQL,以解決問題。

描述: 描述: 未命名2.JPG

 

探討問題3

l   MSSQL裡面的資料做合併

l   SQL裡的指令 LUNION ALL “的目的將兩個以上的 SQL 資料的結果 合併在一起。

描述: 描述: 未命名3.bmp

 

後續發展

l   我們使用SAMPLE TRACK 2資料時,跑WEKA是順利的,但是使用我們資料庫時就會發現形態上的錯誤,以至於無法順利進行。目前正在找方法解決。

 

分工

l   M9905115林俊錡:著重於c語言和sql的研究,並且對資料進行分析。

l   M9905107李悅綾:著重於資料上面的分析與整理,並進行資料的輸入與整合,並且瞭解資料真正的型態。

l   接下來主要研究如何將資料完整的呈現在weka裡,並進行探工作。

 

參考文獻:

I.            SQL SERVER 2005資料採礦聖經(尹相志)

II.         C語言程式設計範例入門 (許 富強)

III.       C語言程式設計 (劉紹漢)