overzicht onderwerpen nalag

Masterproef T707 : Text mining voor het voorspellen van aandeelkoersen

Begeleiding:
Informatie: Sien Moens Marc Van Barel
Promotoren: Sien Moens Marc Van Barel
Begeleider: Jan De Belder
Onderzoeksgroep:
Numerieke Approximatie en Lineaire Algebra Groep
Context:

Online blogs, fora en nieuws bevatten een rijkdom aan informatie over bedrijven en hun producten. We willen deze informatie automatisch extraheren uit deze bronnen en op basis ervan voorspellingen maken met betrekking tot de koers van aandelen van een bepaald bedrijf.

Doel:

De thesis betreft het ontwerp, de implementatie en evaluatie van text en data mining technieken voor het analyseren van blogs, fora en nieuwsteksten, en het voorspellen van aandeelkoersen op basis van de uit deze teksten bekomen informatie.

Uitwerking:
  • Literatuurstudie van bestaande predictiemodellen van aandeelkoersen op basis van nieuwsberichten.
  • Implementatie van sentimentanalysetechnieken die positieve of negatieve berichtgeving over een bedrijf herkennen in de nieuwsberichten door gebruik te maken van temporele aligneringstechnieken en technieken van machinaal leren die robuust zijn t.o.v. ruizige input.
  • Het gebruik van state-of-the-art data mining methoden om voorspellingen te maken op basis van historische data en van de geëxtraheerde positieve en negatieve berichtgeving.
  • Grondige evaluatie en vergelijking met de literatuur.
  • Een dataset bestaande uit nieuwsberichten en cijfermateriaal over de evolutie van aandeelkoersen wordt ter beschikking gesteld van de student.
Relevante literatuur:
  • Aase, K. (2011). Text Mining of News Articles for Stock Price Predictions; PhD Thesis, Norwegian Institute of Science and Technology.
  • Bollen, J., Mao, H., & Zeng, X. (2011). Twitter mood predicts the stock market. Journal of Computational Science, 2 (1), 1-8.
  • Schumaker, R.P. & Chen, H. (2010). A quantative stock prediction system based on financial news. Information Processing & Management, 45 (5), 571-583.
Profiel:

De student heeft interesse in text analytics. Enige kennis van machinaal leren en data mining is wenselijk.

Deze masterproef is voor 1 student.

keyboard_arrow_up