วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

คาบ 9 - - Data Warehouse- - 19/01/11

Data warehouse 

Date warehouse คือ สถานที่จัดเก็บข้อมูลอยู่ในระบบ database มีประโยชน์ คือ
  - เข้าถึงข้อมูลได้เร็ว เนื่องจากข้อมูลอยู่แหล่งเดียวกัน
  - เข้าถึงข้อมูลได้ง่าย เนื่องจากฐานข้อมูลอยู่บน Web browser

ลักษณะของ Data warehouse
  1.Organization มีการกรองข้อมูลจากแหล่งต่างๆ รวมเข้าในระบบเดียวกัน ซึ่งเรียกว่า Data warehouse แบ่งข้่อมูลตามหัวข้อ
  2.Consistency เป็นการกรองข้อมูลให้มีรูปแบบตรงกัน ป้องกันข้อมูลซ้ำซ้อน และผิดพลาดในการนำไปใช้


Data Warehouse Processing
  1.รวบรวมข้อมูล โดยจัดเก็บข้อมูลทั้งภายในและนอกองค์กร
  2.ทำ meta data โดยนำข้อมูลมาสร้างเป็น meta data ซึ่งใช้อฺธิบายข้อมูลต่างๆ ที่อยู๋ใน warehouse
  3.ทำ Data staging โดยจัดระบบและสร้างเป็น data cube มี 4 ขั้นตอน ได้แก่ extract,clean,transform และ load
  4.สร้าง data warehouse นำข้อมูลมาทำเป็นแหล่งจัดเก็บฐานข้อมูล ยึดวัตถุประสงค์ของธุรกิจเป็นสำคัญ
  5.สร้าง business view เป็นการนำเสนอข้อมูลสำหรับผู้บริหาร โดยต้องอยู่ในรูปแบบที่ง่าย เพื่ออำนวยความสะดวกในการนำไปใช้ของผู้บริหาร

Data Mart 
  Data mart เป็นการรวบรวมข้อมูลในคลังข้อมูลเดียวกัน (Data warehouse)ของแต่ละหน่วยงานในองค์กร มี 2 ประเภท
  1. Replicated(Dependent) Data mart เป็นการสร้าง data warehouse ขององค์กรแล้วนำข้อมูลที่จำเป็นไปยังแต่ละแผนก
  2. Stand-alone Data Mart เป็นกาีรสร้าง Data mart ของแผนก โดยไม่มี Data warehouse ของบริษัท เนื่องจากบริษัทยังไม่มีความพร้อม แต่มีข้อเสีย คือ เนื่องจากข้อมูลแต่ละแผนกมีรูปแบบไม่เหมือนัน ทำให้มีความยากในการจัดการและประสบความสำเร็จยาก


Data Cube
  Data Cube เป็น Multidimensional databases เพื่อสามารถมองข้อมูลในภาพรวมได้หลายมิติขึ้น มีข้อดี คือ สามารถแบ่งข้อมูลเฉพาะที่ต้องการวิเคราะห์และนำไปใช้่งานได้ในหลายมุมมอง และเห็นปัญหาชัดขึ้น ซึ่งมีคุณสมบัติ ดังนี้
- Queries
- Slices and dices of the information
- Rollups
- Drill downs

ฺีBusiness Intelligence
  Business Intelligence(BI) คือ กระบวนการรวมโครงสร้างระบบ เครื่องมือ ฐานข้อมูลและ application ต่างๆ ซึ่งช่วยในการวิิเคราะห์ข้อมูลให้มีประสิทธิภาพ มี 3 องค์ประกอบ ดังนี้
  1. Reporting and analysis เป็นการรายงานข้อมูล มี 3 รูปแบบ
      - Enterprise Reporting System เป็นรายงานรูปแบบปกติและสามารถแก้ไขได้ เหมาะกับผู้บริหารในการนำไปวิเคราะห์
      - Dashboards เป็นการรายงานข้อมูลของ Visual displays แบ่งเป็น 3 ระดับ ได้แก่ operation dashboard, Tactical Dashboard และ Strategic dashboard
      - Scorecard เป็นรายงานสำหรับผู้บริหาร ผู้จัดการระดับ Strategy ซึ่งเป็นการนำหลักการของ Balance Scorecard แลัมีการกำหนด KPIs เพื่อประเมินผลและตรวจสอบ
  2. Analytic การนำเครื่องมือต่างๆมาใช้วิเคราะห์ข้อมูล เช่น Business Performance (BPM)
  3. Data mining เป็นการค้นหาข้อมูลในอดีตมาใช้หรือเป็นการแยกข้อมููลเพื่อพยากรณ์แนวโน้มในอนาคตมีทั้งหมด 5 รูปแบบ ได้แก่
      - Clustering ข้อมูลมีความสัมพันธ์กันเอง
      - Classification ข้อมูลตามสมมติฐานและทดสองว่าจริงหรือไม่
      - Association ข้อมูลที่เกิดจากการวิเคราะห์
      - Sequence discovery ผลที่ตามมา
      - Prediction ข้อมูลที่ไว้คาดการณ์ในอนาคต

ดวงกมล ลาภกาญจนพงศ์ 5202115290

วันพฤหัสบดีที่ 13 มกราคม พ.ศ. 2554

คาบที่8 Data management 12-01-11

Data management

ระบบ (System) คือ การใส่ input เข้าไปใน process ให้เกิด output ตามวัตถุประสงค์ที่กำหนดไว้ ซึ่งวัตถุประสงค์จะเป็นตัวกำหนดว่า input ประกอบดัวยอะไรบ้าง ดังนั้นหากใส่ input ต่างกัน input ก็จะต่างกันด้วย

ระบบสารสนเทศ (Information system) คือ ระบบที่เก็บรวบรวมข้อมูล เพื่อนำไปวิเคราะห์และใช้ประโยชน์ในอนาคต ซึ่งแตกต่างกันออกไปตามแต่ละวัตถุประสงค์ และแต่ละสาขาที่ต้องการ เช่น MKIS สำหรับงานการตลาด AIS สำหรับงานบัญชี เป็นต้น

 ความแตกต่างระหว่าง data และ information
   data คือ ข้อเท็จจริงที่สนใจ
   information คือ ข้อมูลที่ผ่านการประมวลผลและวิเคราะห์แล้ว เพื่อนำไปใช้ในรูปแบบที่ต้องการ


Data manament
 การจัดการข้อมูล มีปัญหาต่างๆ หลายสาเหตุ ได้แก่
1.ไม่สามารถเก็บข้อมูลได้ทุกอย่าง เพราะจำนวนข้อมูลเพิ่มมากขึ้น
2. ข้อมูลกระจัดกระจาย เก็บรวบรวมยาก
3. ข้อมูลมีความซับซ้อน
4. รูปแบบของข้อมูลมีความแตกต่างกัน
5. ความปลอดภัย คุณภาพและจริยธรรมในการใช้ข้อมูล
6. เครื่องมือที่ใช้ข้อมูล


ขั้นตอนของ Data management
1. Data profiling ข้อมูลที่จัดเก็บเบื้องต้น ได้แก่ ใครเป็นผู้สร้าง ใครใช้ เก็บที่ไหน อย่างไร
2. Data quality management การพัฒนา ปรับปรุงคุณภาพของข้อมูล
3. Data integration การรวบรวมข้อมูลจากหลายแห่ง
4. Data augmentation การเพิ่มคุณค่าของข้อมูล

Data life cycle process
1. รวบรวมข้อมูล จาก Internal,External และ personal
2. เก็บรวบรวมไว้ใน data warehouse
3. ผู้ใช้ดึงข้อมูลไปใช้ในการวิเคราะห์

ลักษณะของ Data warehouse
1. Organization จัดหมวดหมู่ของข้อมูลตามหัวข้อ
2. Consistency ข้อมูลต้องมีรูปแบบที่สม่ำเสมอ
3. Time variant ข้อมูลที่เก็บนาน 5-10 ปี สามารถนำมาวิเคราะห์หาแนวโน้มได้
4. Non-volatile ไม่มีการแก้ไขข้อมูลในอดีต
5. Client/server ใช้ server ให้ผู็ใช้สามารถเข้าถึงข้อมูลได้ง่าย