LÊ Đình Tư (Trích từ: Lê Đình Tư & Vũ Ngọc Cân. Nhập môn ngôn ngữ học. Hà Nội, 2009)
1. Hình vị – đơn vị ngôn ngữ nhỏ nhất có nghĩa
Nhiều người cứ nghĩ rằng, khi kết hợp các âm tố với nhau, ta sẽ có các từ. Sự thực thì không phải bao giờ cũng như vậy. Nếu kết hợp các âm [ă], [n] và thanh ngang lại với nhau thì ta thu được một tổ hợp âm “ăn” của tiếng Việt, có ý nghĩa hoàn chỉnh và ta có thể kết hợp nó với các đơn vị như “tôi” và “cơm” thành một thông báo: “Tôi ăn cơm”. Song, nếu ta kết hợp các âm [d], [ă], [n] và thanh sắc, thành tổ hợp âm “đắn” thì rõ ràng tổ hợp âm này không cho ta ý nghĩa nào cả, và do đó, ta không thể dùng nó để kết hợp trực tiếp với các đơn vị khác thành một thông báo. Chẳng hạn, không thể kết hợp nó như là một tính từ để tạo ra một câu, kiểu như: “Ông ấy có nước da đắn”. Tổ hợp âm này chỉ xuất hiện trong một đơn vị lớn hơn là “đỏ đắn”, và chỉ trong đơn vị ấy, “đắn” mới cho ta một ý nghĩa nào đấy. Nói là nó cho ta một ý nghĩa nào đấy, bởi vì khó ai có thể nói rõ “đắn” biểu thị cái gì, nhưng chắc chắn là nó có nghĩa, vì rằng nó giúp ta phân biệt “đỏ đắn” với “đỏ au” hay “đỏ”. Một loạt các đơn vị trong tiếng Việt đều có chung tính chất như vậy, ví dụ như: đèm, biêng, tiêng, núc, hấu, v.v… . ở nhiều ngôn ngữ, những đơn vị như vậy được gắn chặt với các đơn vị có nghĩa hoàn chỉnh, làm thành một bộ phận của chúng, ví dụ như: -er trong worker (công nhân), singer (ca sĩ) của tiếng Anh, hay – at’el trong pisat’el’ (nhà văn), prepodava t’el’ (giáo viên) trong tiếng Nga. Chúng ta chỉ có thể biết được chúng nhờ vào sự xuất hiện lặp đi lặp lại, với cùng một ý nghĩa hoặc với ý nghĩa tương đối giống nhau của chúng. Nói rằng chúng lặp đi lặp lại, nhưng không phải bao giờ hình thức của chúng cũng giữ được nguyên vẹn mà có thể bị thay đổi đến một mức độ nhất định, và khi ấy, để nhận diện chúng, ý nghĩa cấu tạo của chúng sẽ là căn cứ quan trọng. Chẳng hạn, beg- trong begat’ (chạy) của tiếng Nga có dạng thức là bež trong từ beženets (vận động viên chạy), hoặc write [rait] và written [rit] trong tiếng Anh cũng khụng hoàn toàn giống nhau. Đơn vị đó được coi là đơn vị ngôn ngữ nhỏ nhất có nghĩa. Các nhà ngôn ngữ học gọi đó là hình vị hay từ tố.
Như vậy, hình vị (hay từ tố) là đơn vị nhỏ nhất có nghĩa của ngôn ngữ, chúng tồn tại bằng cách lặp đi lặp lại dưới cùng một dạng hoặc dưới dạng tương đối giống nhau trong các từ.
2. Từ là gì?
Tuy rằng xét ở nhiều khía cạnh, từ là đơn vị cơ bản, là đơn vị trung tâm trong toàn bộ hệ thống các đơn vị của ngôn ngữ, song việc xác định từ không phải lúc nào cũng thuận lợi và khó có thể nêu lên được một định nghĩa thật chính xác về từ, bởi lẽ từ không phải là loại đơn vị thuần nhất. Từ có thể khác nhau ở nhiều khía cạnh: khả năng thay đổi hình thức cấu tạo, khả năng biểu thị sự vật, hiện tượng, khả năng biểu thị khái niệm, khả năng biểu thị đặc trưng, tính chất, hành động hay hoạt động, khả năng liên kết các đơn vị ngôn ngữ, khả năng biểu thị trạng thái tâm – sinh lý, v.v… Do vậy, chúng ta sẽ nêu lên đây những đặc trưng cơ bản của từ, để từ đó có thể nêu lên một định nghĩa khả dĩ chấp nhận được về từ. Trước hết, từ là một cấu trúc âm thanh, có thể được tách ra khỏi chuỗi lời nói một cách dễ dàng và hiển nhiên, nhờ vào các yếu tố siêu đoạn tính. Trong một số ngôn ngữ, như tiếng Séc, Pháp, Ba Lan… thì yếu tố siêu đoạn đó là vị trí cố định của trọng âm trong từ. Nhờ vào trọng âm từ mà người ta biết rõ khi nào thì từ bắt đầu và kết thúc. Trong tiếng Nga hay tiếng Anh thì đó là trọng âm lực, kèm theo những thay đổi về độ dài của nguyên âm trong âm tiết mang trọng âm và chất lượng của các nguyên âm trong những âm tiết không mang trọng âm. Ở những ngôn ngữ có trọng âm nhạc tính như tiếng Nhật hay tiếng Hàn, việc nhận diện các từ được thực hiện nhờ sự nhận biết sự thay đổi về độ cao của giọng nói khi phát âm các âm tiết khác nhau của từ. Trong khi đó thì người Việt lại dựa vào thanh điệu (đối với các từ một âm tiết), hoặc cả thanh điệu và trọng âm lực (đối với các từ đa tiết) để nhận diện các từ. Cấu trúc âm thanh của từ khá ổn định, tuy mức độ ổn định có khác nhau tuỳ theo từng ngôn ngữ. Chính vì vậy mà từ có thể được giữ lại trong trí nhớ các thành viên của cộng đồng ngôn ngữ dưới dạng những “hình ảnh âm thanh”. Thứ hai, từ có một cấu trúc hình thức tương đối chặt chẽ, không cho phép ta dễ dàng phá vỡ nó bằng những cách thức như chêm xen các yếu tố khác vào giữa các bộ phận cấu tạo của chúng. Chẳng hạn, ta không thể chêm xen các từ như này, kia, ấy, của… vào giữa các bộ phận cấu tạo của các từ máy bay hay giáo trình. Trong khi đó thì máy tốt không phải là một từ vì ta có thể chêm xen các yếu tố khác vào giữa hai bộ phận “máy” và “tốt”, ví dụ: Cái máy này tốt. Chính vì vậy, có những đơn vị có hình thức ngữ âm rất giống nhau, nhưng đơn vị này là từ, còn đơn vị kia lại không phải là từ. Chẳng hạn, chân vịt trong con tàu thuỷ là một từ, nhưng chân vịt với nghĩa là chân của con vịt thì là hai từ. Thứ ba, từ có nội dung ý nghĩa hoàn chỉnh. Đối với các thực từ (hay còn gọi là từ từ vựng), tức những từ biểu thị sự vật, hiện tượng, đặc trưng, tính chất v.v…, thì đó là nội dung khái niệm về các sự vật hay hiện tượng… mà từ biểu thị. Nội dung khái niệm này là những chỉnh thể. Nếu có một tác động nào đó nhằm chia cắt từ thành những bộ phận nhỏ hơn thì tính hoàn chỉnh của nội dung khái niệm đó sẽ bị phá vỡ. Thực vậy, từ ngã lòng trong tiếng Việt biểu thị khái niệm về trạng thái tâm lý: chán nản, không muốn tiếp tục một công việc đang làm. Nếu ta chia cắt nó thành hai bộ phận là ngã và lòng thì mỗi bộ phận sẽ biểu thị một nội dung khái niệm hoàn toàn khác mà khi cộng laị, ta sẽ thu được một nội dung ý nghĩa khác, hoặc không thu được một nội dung ý nghĩa rõ rệt nào cả. Tuy nhiên, tính hoàn chỉnh của nội dung khái niệm không phải bao giờ cũng giống nhau ở tất cả các ngôn ngữ. Như từ ‘ink-pot’ (lọ mực) trong tiếng Anh chẳng hạn, ta có thể phân tích nó thành “ink” (mực) và “pot” (lọ), trong đó mỗi bộ phận dường như vẫn có ý nghĩa hoàn chỉnh và nếu cộng hai ý nghĩa đó lại với nhau, dường như ta vẫn thu được ý nghĩa giống như từ ‘ink-pot’. Song, ngay cả trong những trường hợp như vậy, sự khác nhau giữa hai ý nghĩa vẫn tồn tại, tuy có khó nhận thấy hơn. Có thể diễn giải sự khác nhau đó như sau: Ink + pot = ink và pot, còn ink-pot = pot để đựng ink. Có thể dễ dàng nhận thấy rằng, ngay cả khi không có mực, một cái lọ mực vẫn cứ được gọi là lọ mực chứ không giống như trường hợp “ink + pot” (lọ và mực), trong đó mực luôn luôn phải có mặt. Như vậy, ý nghĩa của từ ink-pot vẫn chỉ là một nội dung khái niệm hoàn chỉnh, chứ không phải là do hai nội dung khái niệm cộng lại mà thành. Còn đối với những từ không có chức năng biểu thị khái niệm (gọi là hư từ hoặc từ ngữ pháp) thì nội dung ý nghĩa đó là chức năng ngữ pháp được quy định chặt chẽ cho từng từ trong hệ thống ngôn ngữ. Những từ mà, và, nhưng của tiếng Việt; i, do, iz, của tiếng Nga, hay of, on, but của tiếng Anh, sở dĩ có thể đứng độc lập và được lưu giữ trong trí nhớ của người Việt, người Nga, hay người Anh là do tính hoàn chỉnh về chức năng ngữ pháp của chúng. Do có chức năng ngữ pháp riêng của mình mà mỗi hư từ trở thành một từ độc lập, cho dù nhiều khi hình thức của chúng có vẻ giống như những bộ phận của từ (tức là hình vị), như các giới từ na (trên), v (trong), s (với) trong tiếng Nga chẳng hạn; những từ đó không có trọng âm riêng và nhiều khi phụ thuộc về mặt ngữ âm vào thực từ. Ý nghĩa của các từ này là những loại quan hệ khác nhau giữa các từ mà chúng được dùng để biểu thị. Và xét về chức năng biểu thị quan hệ, mỗi hư từ là một đơn vị duy nhất, không thể thay thế, chứ không giống như các hình vị, vốn là những đơn vị có thể dùng chung cho nhiều từ và có thể bị thay thế (so sánh: singer [ca sĩ] / cooker [cái bếp] của tiếng Anh. Thứ tư, từ là một loại đơn vị có sẵn trong ngôn ngữ. Tính có sẵn của từ thể hiện ở chỗ chúng đã được tạo ra, được chấp nhận và được lưu giữ trong toàn thể cộng đồng ngôn ngữ, không phụ thuộc vào cá nhân những người sử dụng. Muốn sử dụng ngôn ngữ, người ta không phải tự mình tạo ra các từ, mà cần phải ghi nhớ chúng và tái hiện chúng đúng như chúng vẫn tồn tại cho toàn thể cộng đồng. Đối với những ngôn ngữ mà từ có những dạng thức tồn tại khác nhau, như các dạng thức cách hay thời trong tiếng Nga, tiếng Séc, tiếng Ba Lan chẳng hạn, thì các dạng thức đó của từ chỉ là những biến thể chức năng và người sử dụng các ngôn ngữ đó cũng phải ghi nhớ để tái hiện chúng như là những đơn vị có sẵn, chứ không ghi nhớ phần gốc của từ và phần biến thái của chúng một cách riêng rẽ, rồi khi sử dụng ngôn ngữ mới ghép chúng lại với nhau thành từ. Chẳng hạn, để có thể sử dụng được dạng thức worked của từ (to) work trong tiếng Anh, người ta không ghi nhớ work và ed riêng rẽ rồi mỗi khi giao tiếp lại kết hợp chúng với nhau, mà phải ghi nhớ và tái hiện toàn bộ dạng thức như là một chỉnh thể có sẵn. Điều này đã được chứng minh qua các công trình nghiên cứu về sự phát triển ngôn ngữ ở trẻ em Anh: Khi học nói, trẻ em ghi nhớ các dạng thức của từ như là những vật liệu có sẵn, nhưng đến khi nắm được ngôn ngữ ở một mức độ nhất định, chúng “sửa lại” ngôn ngữ cho đúng với hệ thống, dẫn đến những lỗi ngữ pháp, như thay vì nói went (đã đi) chúng lại nói goed cho đúng với phần lớn dạng thức quá khứ của động từ tiếng Anh. Tính có sẵn là đặc trưng của từ. Các đơn vị khác thường không mang tính có sẵn. Âm vị và hình vị chỉ xuất hiện trong các từ, chứ không đứng độc lập. Câu thì tuy có thể đứng độc lập nhưng lại do các cá nhân tạo ra. Chính vì vậy, cùng một nội dung thông báo, người ta có thể diễn đạt bằng nhiều câu khác nhau. Chẳng hạn, cùng một nội dung: Nó đang ngủ say, ta có thể nói: Nó đang ngủ khì, hoặc Nó đang say giấc nồng. Với từ thì không thể như vậy. Để biểu thị một nội dung khái niệm: Động vật nuôi họ với hổ báo, nuôi để bắt chuột, người Việt chỉ có thể dùng từ mèo, chứ không thể dùng từ khác. Dĩ nhiên, ta phải loại trừ những trường hợp có biến thể phương ngữ, biến thể xã hội hay biến thể nguồn gốc (sẽ được đề cập đến ở phần sau). Như vậy, có thể nói, so với câu thì từ là đơn vị mang tính bắt buộc. Đó chính là do tính có sẵn của từ. Từ những điều trình bầy trên đây, ta có thể đưa ra một định nghĩa khái quát về từ như sau:
Từ là đơn vị cơ bản của ngôn ngữ, có thể dễ dàng tách khỏi chuỗi âm thanh lời nói, có cấu trúc hình thức chặt chẽ, có nội dung ý nghĩa hoàn chỉnh và được sử dụng như là những vật liệu có sẵn để tạo ra những đơn vị thông báo.
3. Các đơn vị tương đương từ
Trong ngôn ngữ, bên cạnh các từ, ta còn có thể nhận thấy một loạt những đơn vị tuy không phải là từ nhưng có tính chất và chức năng giống như các từ. Ta gọi đó là những đơn vị tương đương từ.
4.1. Trước hết, đó là các nhóm ngữ cú hay còn gọi là các cụm từ cố định. Các nhóm ngữ cú được hình thành trong lịch sử phát triển của một ngôn ngữ. Mỗi nhóm ngữ cú là một tổ hợp từ, trong đó từng từ riêng lẻ thường đã mất đi ý nghĩa vốn có của nó. Nghĩa của nhóm ngữ cú là nghĩa chung cho toàn bộ tổ hợp, chứ không phải là nghĩa của các từ cộng lại. Vì vậy, để có thể hiểu được và sử dụng được các nhóm ngữ cú, ta thường phải ghi nhớ chúng như là những chỉnh thể, cùng với nghĩa chung cho toàn bộ nhóm và khi sử dụng, ta không thể tuỳ tiện thay đổi tổ chức của chúng. Nói cách khác, nhóm ngữ cú có kết cấu chặt chẽ và ý nghĩa hoàn chỉnh. Nghĩa của nhóm ngữ cú có thể tương đương với nghĩa của một từ, vì vậy ta có thể dùng chúng như những từ bình thường. Tuy nhiên, cũng có những nhóm ngữ cú mà cấu trúc và ý nghĩa rất giống với những nhóm từ tự do, nhưng đã được cố định hóa và được cộng đồng sử dụng như là những đơn vị có sẵn. Như vậy, các nhóm ngữ cú là những đơn vị ngôn ngữ được tạo ra và duy trì trong cộng đồng ngôn ngữ như là những đơn vị có sẵn, do vậy chúng không mất đi sau một hoạt động giao tiếp ngôn ngữ. Mọi thành viên trong cộng đồng đều phải ghi nhớ chúng như ghi nhớ các từ bình thường.
Trong các nhóm ngữ cú, người ta thường phân biệt hai loại:
a/ Thành ngữ
Đó là những tổ hợp từ có tính ổn định cao về tổ chức hình thức và nghĩa. Thành ngữ được tạo ra theo nhiều cách, nhưng thường có một đặc điểm chung là các từ tạo nên thành ngữ đã mất hẳn tính độc lập của chúng, vì thế ta thường không thể giải thích được lý do tại sao chúng được kết hợp với nhau, và không thể suy ra nghĩa của thành ngữ bằng cách tìm hiểu nghĩa của các từ hợp thành. Chẳng hạn, thành ngữ “mạt cưa, mướp đắng” có nghĩa là: ‘tay đáo để lại gặp tay đáo để khác,; nghĩa đó không thể suy ra từ nghĩa của các từ mạt cưa và mướp đắng, vốn là tên gọi của hai sự vật không có liên quan gì với nhau và lại càng không có liên quan gì với nghĩa của thành ngữ. Chính vì vậy, khi sử dụng một thành ngữ, người ta thường không để ý đến nghĩa của các từ cấu tạo nên nó mà chỉ nghĩ đến ý nghĩa chung của cả tổ hợp mà thôi. Và cũng chính vì không giải thích được lý do cấu tạo của thành ngữ mà người ta không thể tùy tiện thay đổi cấu tạo của chúng. Những tổ hợp từ như: mẹ tròn con vuông; lọt mắt xanh; nằm gai nếm mật, v.v. là những thành ngữ.
b/ Quán ngữ
Đó là những lối nói do sử dụng lâu ngày mà quen dần và trở lên ổn định về tổ chức hình thức và nghĩa. Khác với thành ngữ, trong quán ngữ, các từ vẫn còn giữ được tính độc lập tương đối của chúng, vì thế thường ta có thể suy ra nghĩa của quán ngữ bằng cách tìm hiểu ý nghĩa của các từ hợp thành. Nói chung, ta đều có thể giải thích lý do cấu tạo của quán ngữ. Chẳng hạn, quán ngữ “đẹp như tiên” là quán ngữ so sánh. Dựa vào ý nghĩa của các từ trong quán ngữ này, ta có thể hiểu ngay được ý nghĩa của nó. Do hiểu được ý nghĩa cấu tạo của quán ngữ nên đôi khi, ta có thể thay đổi chút ít thành phần cấu tạo của chúng. Chẳng hạn, ta có thể mở rộng quán ngữ trên thêm một chút thành “đẹp như tiên sa”, hay quán ngữ “khỏe như voi” có thể thay bằng “khoẻ như trâu”. Tất cả những lối nói như: nói có bàn thờ, khôn nhà dại chợ, lừ đừ như từ vào đền, khoẻ như voi, v.v. đều là những quán ngữ. Như vậy, có thể thấy rằng mối quan hệ giữa các từ tạo thành quán ngữ không vững chắc như trong thành ngữ, do đó nhiều khi các quán ngữ được sử dụng giống như các cụm từ tự do.
c/ Từ phức.
Trong mỗi ngôn ngữ, ta còn có thể nhận thấy rằng, có một số từ luôn luôn được một yếu tố cú pháp cố định đi kèm. Khi sử dụng những từ như vậy, ta không thể tuỳ tiện thay đổi hay gạt bỏ yếu tố cú pháp ấy đi. Chẳng hạn, trong tiếng Việt, có từ ‘ghen’ được dùng với hai nghĩa: 1/ ghen tị và 2/ ghen tuông. Ở nghĩa thứ nhất, từ này bao giờ cũng được sử dụng kèm với giới từ ‘với’ (‘ghen với ai’), còn ở nghĩa thứ hai, nó chỉ được dùng một mình. Khi sử dụng từ này với nghĩa thứ nhất, người Việt không thể tự ý gạt bỏ giới từ ‘với’ hay thay vào đó một yếu tố khác. Vì vậy, có thể nói rằng: ‘ghen với…’ là một kết cấu vững chắc và hoàn chỉnh; nó được sử dụng như là một đơn vị có sẵn. Loại đơn vị này ngôn ngữ nào cũng có, ví dụ như look at (nhìn), look for (tìm) trong tiếng Anh chẳng hạn. Ta gọi đó là những từ phức. Muốn sử dụng đúng các từ phức, người ta phải ghi nhớ chúng như là những đơn vị có sẵn. d/ Cuối cùng, trong mỗi ngôn ngữ, đều có tồn tại một số tổ hợp từ dùng để biểu thị những sự vật, hiện tượng hay khái niệm mà trong ngôn ngữ đó không có hình thức từ thích hợp đứng làm cái đại diện vật chất, ví dụ như: ‘máy bay lên thẳng’, ‘trường đại học tổng hợp’ trong tiếng Việt, ‘forget-me-not’ (hoa lưu li), ‘organ-grinder’ (người chơi đàn quay) trong tiếng Anh, hay ‘moxkitnaja xetka’ (cái màn), ‘p’es’ernưi trelov’ek’ (người ở hang) trong tiếng Nga. Các nhóm từ này bao giờ cũng hoạt động như là những chỉnh thể có sẵn và hoàn toàn tương ứng với từ về mặt chức năng, do đó hoàn toàn có thể xem chúng như là những đơn vị tương đương từ và cũng có thể gọi chúng là những từ phức, hoặc là đơn vị trung gian như một số nhà nghiên cứu đề nghị.
Từ vựng
Toàn bộ vốn từ và các đơn vị tương đương từ như vừa trình bày ở trên làm thành vốn từ vựng của ngôn ngữ. Như vậy, từ vựng không chỉ bao gồm một loại đơn vị thuần nhất mà gồm nhiều loại đơn vị khác nhau. Tuy nhiên, đặc tính chung của các loại đơn vị từ vựng là có cấu trúc bền vững, ý nghĩa hoàn chỉnh, có thể tách ra khỏi chuỗi lời nói để đứng độc lập và có thể trực tiếp kết hợp với nhau theo những quy tắc nhất định thành các đơn vị thông báo. Về cơ bản, các đơn vị từ vựng là những đơn vị lớn nhất mà các thành viên của một cộng đồng ngôn ngữ buộc phải ghi nhớ để sử dụng trong hoạt động giao tiếp ngôn ngữ. Các đơn vị lớn hơn, như câu chẳng hạn, hoàn toàn không có tính bắt buộc về mặt ghi nhớ như vậy; chúng ta chỉ cần ghi nhớ các quy tắc tổ hợp các đơn vị từ vựng thành câu là đủ. Chính vì vậy, số lượng câu mà một cộng đồng có thể sản sinh ra là vô cùng, trong khi từ vựng là một tập hợp hữu hạn các đơn vị.
Mặt khác, như đã nói ở trên, các đơn vị nhỏ hơn từ không có khả năng trực tiếp kết hợp với nhau thành những đơn vị thông báo: âm vị chỉ có thể kết hợp với nhau thành hình vị, hình vị chỉ có thể kết hợp với nhau thành từ. Nói cách khác, các đơn vị nhỏ hơn từ không có khả năng kết hợp trực tiếp với nhau thành những đơn vị lớn hơn từ, ví dụ như cụm từ và câu. Vậy, từ là đơn vị nhỏ nhất có khả năng kết hợp trực tiếp với nhau thành các đơn vị thông báo.
Từ những điều trình bày ở trên, ta có thể đưa ra một định nghĩa chung về từ vựng như sau:
Từ vựng của một ngôn ngữ là tập hợp tất cả những đơn vị ngôn ngữ nào có cấu trúc hình thức bền vững, có nghĩa hoàn chỉnh, lớn nhất về tính bắt buộc ghi nhớ đối với các thành viên của cộng đồng và nhỏ nhất về khả năng trực tiếp kết hợp với nhau để tạo ra các đơn vị thông báo.
______________________________________________