VACANA
School of Liberal Arts
Mae Fah Luang University

ISSN: 2287-0903

 

ทฤษฎีโครงสร้างวาทะ: จากมุมมองเชิงทฤษฎีสู่การประมวลผลภาษาไทย

ศุภวัจน์ แต่รุ่งเรือง

Abstract


บทคัดย่อ

ทฤษฎีโครงสร้างวาทะเป็นทฤษฎีว่าด้วยการจัดองค์ประกอบของข้อความภายในโครงสร้างปริจเฉท ด้วยจุดเด่นเชิงทฤษฎีที่เอื้อต่อการนำไปประยุกต์ใช้ได้หลากหลาย ทำให้ทฤษฎีนี้ได้รับการยอมรับอย่างกว้างขวางในหลายวงการ โดยเฉพาะอย่างยิ่งในวงการประมวลผลภาษาธรรมชาติ บทความชิ้นนี้มีวัตถุประสงค์เพื่อนำเสนอมโนทัศน์พื้นฐานและพัฒนาการของทฤษฎีดังกล่าว รวมถึงชี้ให้เห็นจุดเด่นที่เอื้อต่อการนำไปพัฒนาต่อยอดในงานหลายแขนง ยิ่งไปกว่านั้น บทความนี้จะได้กล่าวเจาะจงถึงความเกี่ยวข้องระหว่างทฤษฎีโครงสร้างวาทะกับการวิเคราะห์และประมวลผลภาษาไทย จากนั้นจึงจะชี้ให้เห็นประเด็นปัญหาที่เกี่ยวข้องภาษาไทยเพื่อให้เป็นแนวทางการวิจัยในอนาคต


Abstract 
Rhetorical structure theory (RST) is a theory about text organization in discourse structure. Due to its theoretical strengths that allow for a wide range of applications, this theory is widely accepted in many areas, especially in area of natural language processing. This paper aims to present the basic concepts and development of this theory, as well as to highlight its strengths that lead to further development in many fields. Moreover, the relevance between Rhetorical structure theory and the analysis and processing of Thai is addressed in this paper. Then, to guide future research, problematic issues related to Thai are discussed.

Keywords


ทฤษฎีโครงสร้างวาทะ; โครงสร้างปริจเฉท; การประมวลผลภาษาไทย

Full Text:

PDF

References


นลินี อินต๊ะซาว. (2556). การแยกอนุพากย์ภาษาไทยด้วยการใช้แบบจำลองซัพพอร์ตเวกเตอร์แมชชีน. (วิทยานิพนธ์ปริญญามหาบัณฑิต), จุฬาลงกรณ์มหาวิทยาลัย, กทม.

วิโรจน์ อรุณมานะกุล. (2562). การตัดประโยคภาษาไทย: (1) ประโยคคืออะไร. ค้นจาก https://awirote.medium.com/การตัดประโยคคืออะไร-1-ประโยคคืออะไร-f009994fcc40

ศุภวัจน์ แต่รุ่งเรือง. (2560). การตรวจเทียบภายนอกหาการลักลอกในงานวิชาการโดยใช้แบบจำลองซัพพอร์ตเวกเตอร์แมชชีนและการวัดค่าความละม้ายของข้อความ. (วิทยานิพนธ์ปริญญาดุษฎีบัณฑิต), จุฬาลงกรณ์มหาวิทยาลัย, กทม.

ศุภวัจน์ แต่รุ่งเรือง และวิโรจน์ อรุณมานะกุล. (2558). กลวิธีลักลอกงานวิชาการภาษาไทย: การวิเคราะห์ทางภาษาศาสตร์. ภาษาและภาษาศาสตร์, 34(1), 38-65.

Ahmadi, A., & Parhizgar, S. (2017). Coherence Errors in Iranian EFL Learners' Writing: A Rhetorical Structure Theory Approach. Journal of Language Horizons, 1(1), 9-37. doi: 10.22051/lghor.2017.8588.1011

Bhatia, P., Ji, Y., & Eisenstein, J. (2015). Better Document-level Sentiment Analysis from RST Discourse Parsing. In L. Màrquez, C. Callison-Burch, & J. Su (Eds.), Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (pp. 2212-2218). Lisbon, Portugal: Association for Computational Linguistics.

Braud, C., Coavoux, M., & Søgaard, A. (2017). Cross-lingual RST Discourse Parsing. In M. Lapata, P. Blunsom, & A. Koller (Eds.), Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics: Volume 1, Long Papers (pp. 292-304). Valencia, Spain: Association for Computational Linguistics.

Brown, J. D., & Verhagen, A. (2018). Using Rhetorical Structure Theory for Contrastive Purposes: A Pilot Study. OnCUE Journal, 11(1), 3-24.

Carlson, L., & Marcu, D. (2001). Discourse tagging reference manual. CA: University of Southern California Information Sciences Institute.

Carlson, L., Marcu, D., & Okurowski, M. E. (2001). Building a discourse-tagged corpus in the framework of Rhetorical Structure Theory. In SIGDIAL '01: Proceedings of the Second SIGdial Workshop on Discourse and Dialogue (Vol. 16, pp. 1-10). Aalborg, Denmark: Association for Computational Linguistics.

Charoensuk, J., Suvakree, T., & Kawtrakul, A. (2005). Thai Elementary Discourse Unit Segmentation by Discourse Segmentation Cues and Syntactic Information. In Proceedings of SNLP 2005: the 6th International Symposium on Natural Language Processing (pp. 85-90). Chiang Rai, Thailand: Chulalongkorn University.

Das, D., & Taboada, M. (2018). RST Signalling Corpus: a corpus of signals of coherence relations. Language Resources and Evaluation, 52(1), 149-184. doi: 10.1007/s10579-017-9383-x

Hirao, T., Yoshida, Y., Nishino, M., Yasuda, N., & Nagata, M. (2013). Single-Document Summarization as a Tree Knapsack Problem. In D. Yarowsky, T. Baldwin, A. Korhonen, K. Livescu, & S. Bethard (Eds.), Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing (pp. 1515-1520). Seattle, Washington, USA: Association for Computational Linguistics.

Hou, S., Zhang, S., & Fei, C. (2020). Rhetorical structure theory: A comprehensive review of theory, parsing methods and applications. Expert Systems with Applications, 157, 113421. doi: 10.1016/j.eswa.2020.113421

Intasaw, N., & Aroonmanakun, W. (2013). Basic principles for segmenting Thai EDUs. In H.-l. Lai & K. Chui (Eds.), Proceedings of the 27th Pacific Asia Conference on Language, Information, and Computation (PACLIC 27) (pp. 491-498). Taipei, Taiwan: Department of English, National Chengchi University.

Ketui, N., Theeramunkong, T., & Onsuwan, C. (2012). A rule-based method for Thai Elementary Discourse Unit Segmentation (TED-Seg). In V. C. S. Lee & K.-L. Ong (Eds.), KICSS '12: Proceedings of the 2012 Seventh International Conference on Knowledge, Information and Creativity Support Systems (pp. 195-202). Melbourne, Australia: IEEE Computer Society.

Ketui, N., Theeramunkong, T., & Onsuwan, C. (2015). An EDU-Based Approach for Thai Multi-Document Summarization and Its Application. ACM Trans. Asian Low-Resour. Lang. Inf. Process., 14(1), Article 4. doi: 10.1145/2641567

Kongwan, A., Kamaruddin, S. S. B., & Ahmad, F. B. K. (2020). Thai EDU Segmentation Using Clue Markers and Syntactic Information from Shallow Parser. Journal of Theoretical and Applied Information Technology, 98(18), 3853-3869.

Kraus, M., & Feuerriegel, S. (2019). Sentiment analysis based on rhetorical structure theory: Learning deep neural networks from discourse trees. Expert Systems with Applications, 118, 65-79. doi: 10.1016/j.eswa.2018.10.002

Lertpiya, A., Chaiwachirasak, T., Maharattanamalai, N., Lapjaturapit, T., Chalothorn, T., Tirasaroj, N., & Chuangsuwanich, E. (2018). A Preliminary Study on Fundamental Thai NLP Tasks for User-generated Web Content. In K. Hashimoto, T. Supnithi, N. Hnoohom, M. Ketcham, P. Songmuang, R. Kongkachandra, K. Wongpatikaseree, N. Chumuang, W. Yimyam, & A. Jitpattanakul (Eds.), Proceedings of the 13th International Joint Symposium on Artificial Intelligence and Natural Language Processing (iSAI-NLP 2018) (pp. 18-25). Pattaya, Thailand: Artificial Intelligence Association of Thailand (AIAT).

Mann, W. C., & Thompson, S. A. (1987). Rhetorical Structure Theory: A Theory of Text Organization. CA: Information Science Institute, Univerisity of Southern California.

Mann, W. C., & Thompson, S. A. (1988). Rhetorical Structure Theory: Toward a functional theory of text organization. Text, 8(3), 243-281.

Marcu, D. (2000a). The rhetorical parsing of unrestricted texts: a surface-based approach. Computational linguistics, 26(3), 395-448.

Marcu, D. (2000b). The Theory and Practice of Discourse Parsing and Summarization. MA: MIT Press.

Morey, M., Muller, P., & Asher, N. (2018). A Dependency Perspective on RST Discourse Parsing and Evaluation. Computational linguistics, 44(2), 197-235. doi: 10.1162/coli_a_00314

O'Donnell, M., Mellish, C., Oberlander, J., & Knott, A. (2001). ILEX: an architecture for a dynamic hypertext generation system. Natural Language Engineering, 7(3), 225-250. doi: 10.1017/S1351324901002698

Prasad, R., Dinesh, N., Lee, A., Miltsakaki, E., Robaldo, L., Joshi, A., & Webber, B. (2008). The Penn Discourse TreeBank 2.0. In N. Calzolari, K. Choukri, B. Maegaard, J. Mariani, J. Odijk, S. Piperidis, & D. Tapias (Eds.), Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC’08) (pp. 2961-2968). Marrakech, Morocco: European Language Resources Association (ELRA).

Radev, D. R. (2000). A common theory of information fusion from multiple text sources step one: cross-document structure. In L. Dybkjær, K. Hasida, & D. Traum (Eds.), Proceedings of the 1st SIGdial workshop on Discourse and dialogue - Volume 10 (pp. 74–83). Hong Kong: Association for Computational Linguistics.

Rahangdale, A., & Agrawal, A. J. (2014). Information Extraction Using Discourse Analysis from Newswires. International Journal of Information Technology Convergence and Services, 4(3), 21-30. doi: 10.5121/ijitcs.2014.4302

Saetia, C., Taerungruang, S., & Chalothorn, T. (2020). Combining Thai EDUs: Principle and Implementation. In L. M. Nguyen, C. M. Luong, & S. Song (Eds.), Proceedings of the 34th Pacific Asia Conference on Language, Information and Computation (pp. 270-278). Hanoi, Vietnam: Association for Computational Linguistics.

Singkul, S., Khampingyot, B., Maharattamalai, N., Taerungruang, S., & Chalothorn, T. (2019). Parsing Thai Social Data: A New Challenge for Thai NLP. In H. Kiyota, T. Supnithi, M. Ketcham, N. Chumuang, P. Songmuang, Supakrit Sukjarern, R. Kongkachandra, J. Donjuntai, S. Lipirodjanapong, A. Rongtong, & J. Kaewjunda (Eds.), Proceeding of the 14th International Joint Symposium on Artificial Intelligence and Natural Language Processing (iSAI-NLP 2019) (pp. 244-250). Chiang Mai, Thailand: Artificial Intelligence Association of Thailand (AIAT).

Sinthupoun, S., & Sornil, O. (2010). Thai rhetorical structure analysis. International Journal of Computer Science and Information Security (IJCSIS), 7(1), 95-105.

Skoufaki, S. (2020). Rhetorical Structure Theory and coherence break identification. Text & Talk, 40(1), 99-124. doi: 10.1515/text-2019-2050

Sukvaree, T., Charoensuk, J., Wattanamethanont, M., & Kultrakul, A. (2004). RST based Text Summarization with Ontology Driven in Agriculture Domain. Bangkok: Department of Computer Engineering, Kasetsart University.

Sukvaree, T., Kawtrakul, A., & Caelen, J. (2007). Thai Text Coherence Structuring with Coordinating and Subordinating Relations for Text Summarization. In B. Kokinov, D. C. Richardson, T. R. Roth-Berghofer, & L. Vieu (Eds.), Modeling and Using Context: Proceeding of the 6th International and Interdisciplinary Conference (CONTEXT 2007) (pp. 453-466). Berlin, Heidelberg: Springer Berlin Heidelberg.

Taboada, M., & Mann, W. C. (2006). Applications of Rhetorical Structure Theory. Discourse Studies, 8(4), 567-588.

Tapsai, C., Unger, H., & Meesad, P. (2021). Thai Natural Language Processing: Word Segmentation, Semantic Analysis, and Application. Cham, Switzerland: Springer.

Voll, K., & Taboada, M. (2007). Not All Words Are Created Equal: Extracting Semantic Orientation as a Function of Adjective Relevance. In M. A. Orgun & J. Thornton (Eds.), AI 2007: Advances in Artificial Intelligence (pp. 337-346). Berlin, Heidelberg: Springer Berlin Heidelberg.

Wahlster, W., Andre, E., Graf, W., & Rist, T. (1991). Designing Illustrated Texts: How Language Production Is Influenced by Graphics Generation. In J. Kunze & D. Reimann (Eds.), Fifth Conference of the European Chapter of the Association for Computational Linguistics (pp. 8-14). Berlin: Association for Computational Linguistics.

Wattanamethanont, M., Suvakree, T., & Kawtrakul, A. (2005). Thai Discourse Relations Recognition By Using naive Bayes Classifier. In Proceedings of SNLP 2005: the 6th International Symposium on Natural Language Processing (pp. 291-296). Chiang Rai: Chulalongkorn University.


Refbacks

  • There are currently no refbacks.


User
Notifications
Journal Content

Browse
Font Size