บทคัดย่อ
ทฤษฎีโครงสร้างวาทะเป็นทฤษฎีว่าด้วยการจัดองค์ประกอบของข้อความภายในโครงสร้างปริจเฉท ด้วยจุดเด่นเชิงทฤษฎีที่เอื้อต่อการนำไปประยุกต์ใช้ได้หลากหลาย ทำให้ทฤษฎีนี้ได้รับการยอมรับอย่างกว้างขวางในหลายวงการ โดยเฉพาะอย่างยิ่งในวงการประมวลผลภาษาธรรมชาติ บทความชิ้นนี้มีวัตถุประสงค์เพื่อนำเสนอมโนทัศน์พื้นฐานและพัฒนาการของทฤษฎีดังกล่าว รวมถึงชี้ให้เห็นจุดเด่นที่เอื้อต่อการนำไปพัฒนาต่อยอดในงานหลายแขนง ยิ่งไปกว่านั้น บทความนี้จะได้กล่าวเจาะจงถึงความเกี่ยวข้องระหว่างทฤษฎีโครงสร้างวาทะกับการวิเคราะห์และประมวลผลภาษาไทย จากนั้นจึงจะชี้ให้เห็นประเด็นปัญหาที่เกี่ยวข้องภาษาไทยเพื่อให้เป็นแนวทางการวิจัยในอนาคต
นลินี อินต๊ะซาว. (2556). การแยกอนุพากย์ภาษาไทยด้วยการใช้แบบจำลองซัพพอร์ตเวกเตอร์แมชชีน. (วิทยานิพนธ์ปริญญามหาบัณฑิต), จุฬาลงกรณ์มหาวิทยาลัย, กทม.
วิโรจน์ อรุณมานะกุล. (2562). การตัดประโยคภาษาไทย: (1) ประโยคคืออะไร. ค้นจาก https://awirote.medium.com/การตัดประโยคคืออะไร-1-ประโยคคืออะไร-f009994fcc40
ศุภวัจน์ แต่รุ่งเรือง. (2560). การตรวจเทียบภายนอกหาการลักลอกในงานวิชาการโดยใช้แบบจำลองซัพพอร์ตเวกเตอร์แมชชีนและการวัดค่าความละม้ายของข้อความ. (วิทยานิพนธ์ปริญญาดุษฎีบัณฑิต), จุฬาลงกรณ์มหาวิทยาลัย, กทม.
ศุภวัจน์ แต่รุ่งเรือง และวิโรจน์ อรุณมานะกุล. (2558). กลวิธีลักลอกงานวิชาการภาษาไทย: การวิเคราะห์ทางภาษาศาสตร์. ภาษาและภาษาศาสตร์, 34(1), 38-65.
Ahmadi, A., & Parhizgar, S. (2017). Coherence Errors in Iranian EFL Learners' Writing: A Rhetorical Structure Theory Approach. Journal of Language Horizons, 1(1), 9-37. doi: 10.22051/lghor.2017.8588.1011
Bhatia, P., Ji, Y., & Eisenstein, J. (2015). Better Document-level Sentiment Analysis from RST Discourse Parsing. In L. Màrquez, C. Callison-Burch, & J. Su (Eds.), Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (pp. 2212-2218). Lisbon, Portugal: Association for Computational Linguistics.
Braud, C., Coavoux, M., & Søgaard, A. (2017). Cross-lingual RST Discourse Parsing. In M. Lapata, P. Blunsom, & A. Koller (Eds.), Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics: Volume 1, Long Papers (pp. 292-304). Valencia, Spain: Association for Computational Linguistics.
Brown, J. D., & Verhagen, A. (2018). Using Rhetorical Structure Theory for Contrastive Purposes: A Pilot Study. OnCUE Journal, 11(1), 3-24.
Carlson, L., & Marcu, D. (2001). Discourse tagging reference manual. CA: University of Southern California Information Sciences Institute.
Carlson, L., Marcu, D., & Okurowski, M. E. (2001). Building a discourse-tagged corpus in the framework of Rhetorical Structure Theory. In SIGDIAL '01: Proceedings of the Second SIGdial Workshop on Discourse and Dialogue (Vol. 16, pp. 1-10). Aalborg, Denmark: Association for Computational Linguistics.
Charoensuk, J., Suvakree, T., & Kawtrakul, A. (2005). Thai Elementary Discourse Unit Segmentation by Discourse Segmentation Cues and Syntactic Information. In Proceedings of SNLP 2005: the 6th International Symposium on Natural Language Processing (pp. 85-90). Chiang Rai, Thailand: Chulalongkorn University.
Das, D., & Taboada, M. (2018). RST Signalling Corpus: a corpus of signals of coherence relations. Language Resources and Evaluation, 52(1), 149-184. doi: 10.1007/s10579-017-9383-x
Hirao, T., Yoshida, Y., Nishino, M., Yasuda, N., & Nagata, M. (2013). Single-Document Summarization as a Tree Knapsack Problem. In D. Yarowsky, T. Baldwin, A. Korhonen, K. Livescu, & S. Bethard (Eds.), Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing (pp. 1515-1520). Seattle, Washington, USA: Association for Computational Linguistics.
Hou, S., Zhang, S., & Fei, C. (2020). Rhetorical structure theory: A comprehensive review of theory, parsing methods and applications. Expert Systems with Applications, 157, 113421. doi: 10.1016/j.eswa.2020.113421
Intasaw, N., & Aroonmanakun, W. (2013). Basic principles for segmenting Thai EDUs. In H.-l. Lai & K. Chui (Eds.), Proceedings of the 27th Pacific Asia Conference on Language, Information, and Computation (PACLIC 27) (pp. 491-498). Taipei, Taiwan: Department of English, National Chengchi University.
Ketui, N., Theeramunkong, T., & Onsuwan, C. (2012). A rule-based method for Thai Elementary Discourse Unit Segmentation (TED-Seg). In V. C. S. Lee & K.-L. Ong (Eds.), KICSS '12: Proceedings of the 2012 Seventh International Conference on Knowledge, Information and Creativity Support Systems (pp. 195-202). Melbourne, Australia: IEEE Computer Society.
Ketui, N., Theeramunkong, T., & Onsuwan, C. (2015). An EDU-Based Approach for Thai Multi-Document Summarization and Its Application. ACM Trans. Asian Low-Resour. Lang. Inf. Process., 14(1), Article 4. doi: 10.1145/2641567
Kongwan, A., Kamaruddin, S. S. B., & Ahmad, F. B. K. (2020). Thai EDU Segmentation Using Clue Markers and Syntactic Information from Shallow Parser. Journal of Theoretical and Applied Information Technology, 98(18), 3853-3869.
Kraus, M., & Feuerriegel, S. (2019). Sentiment analysis based on rhetorical structure theory: Learning deep neural networks from discourse trees. Expert Systems with Applications, 118, 65-79. doi: 10.1016/j.eswa.2018.10.002
Lertpiya, A., Chaiwachirasak, T., Maharattanamalai, N., Lapjaturapit, T., Chalothorn, T., Tirasaroj, N., & Chuangsuwanich, E. (2018). A Preliminary Study on Fundamental Thai NLP Tasks for User-generated Web Content. In K. Hashimoto, T. Supnithi, N. Hnoohom, M. Ketcham, P. Songmuang, R. Kongkachandra, K. Wongpatikaseree, N. Chumuang, W. Yimyam, & A. Jitpattanakul (Eds.), Proceedings of the 13th International Joint Symposium on Artificial Intelligence and Natural Language Processing (iSAI-NLP 2018) (pp. 18-25). Pattaya, Thailand: Artificial Intelligence Association of Thailand (AIAT).
Mann, W. C., & Thompson, S. A. (1987). Rhetorical Structure Theory: A Theory of Text Organization. CA: Information Science Institute, Univerisity of Southern California.
Mann, W. C., & Thompson, S. A. (1988). Rhetorical Structure Theory: Toward a functional theory of text organization. Text, 8(3), 243-281.
Marcu, D. (2000a). The rhetorical parsing of unrestricted texts: a surface-based approach. Computational linguistics, 26(3), 395-448.
Marcu, D. (2000b). The Theory and Practice of Discourse Parsing and Summarization. MA: MIT Press.
Morey, M., Muller, P., & Asher, N. (2018). A Dependency Perspective on RST Discourse Parsing and Evaluation. Computational linguistics, 44(2), 197-235. doi: 10.1162/coli_a_00314
O'Donnell, M., Mellish, C., Oberlander, J., & Knott, A. (2001). ILEX: an architecture for a dynamic hypertext generation system. Natural Language Engineering, 7(3), 225-250. doi: 10.1017/S1351324901002698
Prasad, R., Dinesh, N., Lee, A., Miltsakaki, E., Robaldo, L., Joshi, A., & Webber, B. (2008). The Penn Discourse TreeBank 2.0. In N. Calzolari, K. Choukri, B. Maegaard, J. Mariani, J. Odijk, S. Piperidis, & D. Tapias (Eds.), Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC’08) (pp. 2961-2968). Marrakech, Morocco: European Language Resources Association (ELRA).
Radev, D. R. (2000). A common theory of information fusion from multiple text sources step one: cross-document structure. In L. Dybkjær, K. Hasida, & D. Traum (Eds.), Proceedings of the 1st SIGdial workshop on Discourse and dialogue - Volume 10 (pp. 74–83). Hong Kong: Association for Computational Linguistics.
Rahangdale, A., & Agrawal, A. J. (2014). Information Extraction Using Discourse Analysis from Newswires. International Journal of Information Technology Convergence and Services, 4(3), 21-30. doi: 10.5121/ijitcs.2014.4302
Saetia, C., Taerungruang, S., & Chalothorn, T. (2020). Combining Thai EDUs: Principle and Implementation. In L. M. Nguyen, C. M. Luong, & S. Song (Eds.), Proceedings of the 34th Pacific Asia Conference on Language, Information and Computation (pp. 270-278). Hanoi, Vietnam: Association for Computational Linguistics.
Singkul, S., Khampingyot, B., Maharattamalai, N., Taerungruang, S., & Chalothorn, T. (2019). Parsing Thai Social Data: A New Challenge for Thai NLP. In H. Kiyota, T. Supnithi, M. Ketcham, N. Chumuang, P. Songmuang, Supakrit Sukjarern, R. Kongkachandra, J. Donjuntai, S. Lipirodjanapong, A. Rongtong, & J. Kaewjunda (Eds.), Proceeding of the 14th International Joint Symposium on Artificial Intelligence and Natural Language Processing (iSAI-NLP 2019) (pp. 244-250). Chiang Mai, Thailand: Artificial Intelligence Association of Thailand (AIAT).
Sinthupoun, S., & Sornil, O. (2010). Thai rhetorical structure analysis. International Journal of Computer Science and Information Security (IJCSIS), 7(1), 95-105.
Skoufaki, S. (2020). Rhetorical Structure Theory and coherence break identification. Text & Talk, 40(1), 99-124. doi: 10.1515/text-2019-2050
Sukvaree, T., Charoensuk, J., Wattanamethanont, M., & Kultrakul, A. (2004). RST based Text Summarization with Ontology Driven in Agriculture Domain. Bangkok: Department of Computer Engineering, Kasetsart University.
Sukvaree, T., Kawtrakul, A., & Caelen, J. (2007). Thai Text Coherence Structuring with Coordinating and Subordinating Relations for Text Summarization. In B. Kokinov, D. C. Richardson, T. R. Roth-Berghofer, & L. Vieu (Eds.), Modeling and Using Context: Proceeding of the 6th International and Interdisciplinary Conference (CONTEXT 2007) (pp. 453-466). Berlin, Heidelberg: Springer Berlin Heidelberg.
Taboada, M., & Mann, W. C. (2006). Applications of Rhetorical Structure Theory. Discourse Studies, 8(4), 567-588.
Tapsai, C., Unger, H., & Meesad, P. (2021). Thai Natural Language Processing: Word Segmentation, Semantic Analysis, and Application. Cham, Switzerland: Springer.
Voll, K., & Taboada, M. (2007). Not All Words Are Created Equal: Extracting Semantic Orientation as a Function of Adjective Relevance. In M. A. Orgun & J. Thornton (Eds.), AI 2007: Advances in Artificial Intelligence (pp. 337-346). Berlin, Heidelberg: Springer Berlin Heidelberg.
Wahlster, W., Andre, E., Graf, W., & Rist, T. (1991). Designing Illustrated Texts: How Language Production Is Influenced by Graphics Generation. In J. Kunze & D. Reimann (Eds.), Fifth Conference of the European Chapter of the Association for Computational Linguistics (pp. 8-14). Berlin: Association for Computational Linguistics.
Wattanamethanont, M., Suvakree, T., & Kawtrakul, A. (2005). Thai Discourse Relations Recognition By Using naive Bayes Classifier. In Proceedings of SNLP 2005: the 6th International Symposium on Natural Language Processing (pp. 291-296). Chiang Rai: Chulalongkorn University.