Overview

Parameters and Specifications

Metadata

Sample Data

Sample Metadata

Sample Transcription

Request Data

Overview

Our Conversational Data in Malayalam offers comprehensive and authentic dialogues of Indians conversing in Malayalam. This dataset features conversations that span a wide range of topics, including daily life, business, education, and more. It includes diverse speakers from different regions of India, capturing various accents and dialects to provide a rich linguistic resource.

The data is collected from natural, spontaneous conversations to ensure authenticity, and each conversation is accurately transcribed with annotations for contextual understanding. Additionally, we offer the flexibility to tailor the topics, conversations, and scenarios according to the specific needs of your company, ensuring that the dataset aligns perfectly with your requirements.

Parameters and Specifications

Data type

Conversational, Labelled

Format

Audio - .wav (44100Hz, 16-bit)

Unique Speakers

2

Platform Hardware

Mobile Device

Audio Tracks

Individual Speaker Stems (Stereo)

Metadata

For each recording the following metadata will be available

Age of speakers

Gender

Social Background

Geographical Location

Recording Platform

Topic

Scenario

Accent

Dialect

Sample Data

Individual Speaker Stems

General Conversation

Duration: 0:00

Waveform loading... 0%

0:00
0:00
0:00
0:00
0:00
0:00
0:00
0:00
0:00
0:00
0:00

Speaker 1

Audio - .wav (44100Hz, 16-bit)

Speaker 2

Audio - .wav (44100Hz, 16-bit)

1.0

0.5

0.0

-0.5

-1.0

1.0

0.5

0.0

-0.5

-1.0

Sample Metadata

Sample Transcription

You can request below to get access to our Transcription Guidelines.

Transcription Sample

Speaker 1

25, Female, Trivandrum, Kerala

[
  {
    "index": 0,
    "start_time": 1.9,
    "end_time": 2.4,
    "text": "Hello"
  },
  {
    "index": 1,
    "start_time": "5.6",
    "end_time": "6.5",
    "text": "ഹായ് സുഖാണോ?"
  },
  {
    "index": 2,
    "start_time": 9.1,
    "end_time": 10,
    "text": "ആ സുഖാണ്."
  },
  {
    "index": 3,
    "start_time": 10.2,
    "end_time": 11.6,
    "text": "എന്തൊക്കെ ഇണ്ട് അവിടെ വിശേഷങ്ങള്?"
  },
  {
    "index": 4,
    "start_time": 20.2,
    "end_time": 24.5,
    "text": "ഇവിടെയും അങ്ങനെ തന്നെയാടോ, ഹാ {umm} മഴയും, വെയിലും ഇങ്ങനെ വന്നും പോയും ഇരിക്കെയാണ്. [breathes] "
  },
  {
    "index": 5,
    "start_time": 24.6,
    "end_time": 29.5,
    "text": "{uhh} പിന്നെ ഈ മഴ ഇടക്കിടക്ക് പ്രശ്നമാകുന്നുണ്ട്. വയനാട്ടിലെ സംഭവങ്ങൾ തന്നെ അറിയത്തില്ലേ?"
  },
  {
    "index": 6,
    "start_time": 30.4,
    "end_time": 32,
    "text": "വയനാട്ടില് തുടർച്ചയായിട്ടൊള്ള"
  },
  {
    "index": 7,
    "start_time": 32.6,
    "end_time": 36.5,
    "text": "വയനാട്ടില് തുടർച്ചയായിട്ടുള്ള മഴയും ഉരുൾപ്പൊട്ടലും കാരണം എത്ര പേരാണ് മരിച്ചത്"
  },
  {
    "index": 8,
    "start_time": 37.4,
    "end_time": 39.1,
    "text": "എത്ര പേർക്ക് അവരുടെ വീടുകള്"
  },
  {
    "index": 9,
    "start_time": 39.3,
    "end_time": 44.4,
    "text": "അതെ എത്രപേർക്ക് വീടുകൾ നഷ്ടായി . പാലം ഒലിച്ചുപോയി, വീടുകൾ ഒലിച്ചുപോയി.[breathes]"
  },
  {
    "index": 10,
    "start_time": 44.6,
    "end_time": 51.3,
    "text": "അതിന്റെ ആ ഒരു പശ്ചാത്തലത്തിലാണല്ലോ ഇപ്പോം നമ്മുടെ, നമ്മുടെയൊക്കെ [breathes] കേരളത്തിന്റെ ദേശീയ ഉത്സവായ ഓണം പോലും നിർത്തിവെച്ചിരിക്കുന്നത്."
  },
  {
    "index": 11,
    "start_time": 52.1,
    "end_time": 54.6,
    "text": "ഓണ പരിപാടികളൊന്നും ഔദ്യോഗികമായിട്ടില്ല."
  },
  {
    "index": 12,
    "start_time": 62.1,
    "end_time": 67.8,
    "text": "അതെ, വളരെ വിപുലമായിട്ട് നടത്താനിരുന്നൊരു ആഘോഷമായിരുന്നു.[breathes] മലയാളികൾക്ക് എന്നും പ്രിയപ്പെട്ട ആഘോഷല്ലേ?"
  },
  {
    "index": 13,
    "start_time": 67.9,
    "end_time": 69.3,
    "text": "ദേശീയ ഉത്സവാണ് ഓണം."
  },
  {
    "index": 14,
    "start_time": 72.3,
    "end_time": 75.1,
    "text": "അതെ നമ്മളും അവരോടൊപ്പം ചേർന്നു നിൽക്കുന്നു അവരുടെ ദുഃഖത്തിൽ."
  },
  {
    "index": 15,
    "start_time": 75.3,
    "end_time": 75.7,
    "text": "അതെ"
  },
  {
    "index": 16,
    "start_time": 76.2,
    "end_time": 81.7,
    "text": "അതെ അതെ വീടുകളും ബന്ധുക്കളെയും നഷ്ട്ടപ്പെട്ട അവർക്കൊപ്പം നമ്മളും തൽക്കാലത്തേക്ക് ഈ ഓണാഘോഷങ്ങളൊക്കെ മാറ്റിവെച്ച്"
  },
  {
    "index": 17,
    "start_time": 81.9,
    "end_time": 82.9,
    "text": "പങ്കുചേരുകയാണ്."
  },
  {
    "index": 18,
    "start_time": 83.7,
    "end_time": 85.6,
    "text": "ഓണത്തെക്കുറിച്ച് പറയുമ്പോ എന്തൊക്ക ഓർമ്മകളാണെടോ?"
  },
  {
    "index": 19,
    "start_time": 85.8,
    "end_time": 86.3,
    "text": "ഉള്ളത്?"
  },
  {
    "index": 20,
    "start_time": 98.3,
    "end_time": 107.8,
    "text": "അതേ ഓണം എന്നുപറയുന്നത് എപ്പോഴും നമ്മുക്ക് [breathes] എന്താ സമാധാനത്തിന്റെയും ഐശ്വര്യത്തിന്റെയുമൊക്കെ ഒരു പ്രതീകമാണല്ലോ, [breathes] {hee}, അതിന്റെയൊക്കെ ഏറ്റവും പ്രധാനപ്പെട്ട ആള് തന്നെ മാവേലി എന്ന് പറയുന്ന രാജാവാണ്. [happy]"
  },
  {
    "index": 21,
    "start_time": 108.2,
    "end_time": 109.6,
    "text": "നമ്മുടെയൊക്കെ മാവേലി തമ്പുരാൻ."
  },
  {
    "index": 22,
    "start_time": 113,
    "end_time": 122.8,
    "text": "അതെ തീർച്ചയായും. ഓണത്തിന്റെ സന്ദേശങ്ങള്, ആ ഒരു [breathes] {uhh} ഐശ്വര്യത്തിന്റെയും, നന്മയുടെയും, വിശുദ്ധിയുടെയൊക്കെ സന്ദേശങ്ങൾ പകരുന്നത് തന്നെ [breathes] നമുക്ക് ഒരുപാട് സന്തോഷമുള്ള കാര്യാണ്. [happy]"
  },
  {
    "index": 23,
    "start_time": 123.8,
    "end_time": 129.3,
    "text": "{mm} ഓണത്തില് ഒരുപാട് പ്രവർത്തികളുണ്ട്, പരിപാടികളുണ്ട് ഏറ്റവും ഇഷ്ട്ടപ്പെട്ട പ്രവർത്തി എന്താണ് അല്ലെങ്കിൽ പരുപാടി എന്താണ്? "
  },
  {
    "index": 24,
    "start_time": 132.9,
    "end_time": 136.3,
    "text": "ആഘോഷത്തിന്റെ പ്രധാനപ്പെട്ട ഒരു ആകർഷണമാണ് പുലിക്കളി എന്ന് പറയുന്നത് അല്ലേ?"
  },
  {
    "index": 25,
    "start_time": 147.1,
    "end_time": 148.5,
    "text": "ഓണസദ്യയും അതുപോലെ തന്നെ"
  },
  {
    "index": 26,
    "start_time": 148.7,
    "end_time": 150.6,
    "text": "എന്തായാലും അതുപോലൊരു ഓണം ഉണ്ടാവട്ടെ അല്ലേ"
  },
  {
    "index": 27,
    "start_time": 151.2,
    "end_time": 154.8,
    "text": "നമുക്ക് അടുത്ത വർഷമെങ്കിലും ഓണം, അങ്ങനൊരു ഓണം ഉണ്ടാവട്ടെ അല്ലേ? എന്ന് പറഞ്ഞു നിർത്താം"
  },
  {
    "index": 28,
    "start_time": 155.7,
    "end_time": 156,
    "text": "അല്ലേ?"
  },
  {
    "index": 29,
    "start_time": "157.3",
    "end_time": "160",
    "text": "ശെരി പിന്നെ okay."
  }
]

Speaker 2

28, Female, Ernakulam, Kerala

[
  {
    "index": 0,
    "start_time": 1.8,
    "end_time": 2.3,
    "text": "Hello"
  },
  {
    "index": 1,
    "start_time": 4.8,
    "end_time": 6.5,
    "text": "ആ എന്തൊക്കെയുണ്ട് വിശേഷം?"
  },
  {
    "index": 2,
    "start_time": 8.7,
    "end_time": 9.5,
    "text": "{hmmm} സുഖം."
  },
  {
    "index": 3,
    "start_time": 9.7,
    "end_time": 10.3,
    "text": "നിനക്കോ?"
  },
  {
    "index": 4,
    "start_time": 14.1,
    "end_time": 18.9,
    "text": "വിശേഷം പ്രത്യേകിച്ച് മഴയാണ് മഴ എന്നുപറഞ്ഞാൽ തുടർച്ചയായിട്ടുള്ള മഴയൊന്നും അല്ല"
  },
  {
    "index": 5,
    "start_time": 19.4,
    "end_time": 20.6,
    "text": "വരും പോകും അങ്ങനെ"
  },
  {
    "index": 6,
    "start_time": 20.9,
    "end_time": 21.6,
    "text": "അവിടെയോ?"
  },
  {
    "index": 7,
    "start_time": 32,
    "end_time": 33.9,
    "text": "ദേ, ഇങ്ങനെയങ്ങ് തുടർന്നാ മതിയായിരുന്നു."
  },
  {
    "index": 8,
    "start_time": 38.9,
    "end_time": 41.2,
    "text": "ദേ, ഇപ്പഴും പലരെയും കണ്ടെത്താൻ കഴിഞ്ഞിട്ടില്ല. [sad]"
  },
  {
    "index": 9,
    "start_time": 46.8,
    "end_time": 47.1,
    "text": "അതെ"
  },
  {
    "index": 10,
    "start_time": 53.6,
    "end_time": 54,
    "text": "[inaudible]"
  },
  {
    "index": 11,
    "start_time": 54.2,
    "end_time": 54.9,
    "text": "അതൊക്കെ"
  },
  {
    "index": 12,
    "start_time": 56.6,
    "end_time": 59,
    "text": "അതെ, {va} {ee} {eh} എല്ലാ തവണയെക്കാളെയും"
  },
  {
    "index": 13,
    "start_time": 59.1,
    "end_time": 59.6,
    "text": "ക്കാളും"
  },
  {
    "index": 14,
    "start_time": 59.8,
    "end_time": 60.4,
    "text": "{umm}"
  },
  {
    "index": 15,
    "start_time": 61.1,
    "end_time": 63.5,
    "text": "ഭയങ്കര അടിപൊളിയായിട്ട് നടത്താനിരുന്നതാ ഈ വർഷം."
  },
  {
    "index": 16,
    "start_time": 70.3,
    "end_time": 70.6,
    "text": "അതെ"
  },
  {
    "index": 17,
    "start_time": 71.3,
    "end_time": 74.3,
    "text": "പക്ഷേ ഈ ഒരു വയനാടിന്റെ ദുരിതം കാരണം അത് നിർത്തി അത്"
  },
  {
    "index": 18,
    "start_time": 75.3,
    "end_time": 77.5,
    "text": "അതു വളരെ നല്ലതാണ് ശരിക്കും പറഞ്ഞാ"
  },
  {
    "index": 19,
    "start_time": 85,
    "end_time": 85.6,
    "text": "സത്യം"
  },
  {
    "index": 20,
    "start_time": 87.9,
    "end_time": 96.1,
    "text": "എനിക്ക് എനിക്കെന്ന് പറയുന്ന എന്റെ കുട്ടിക്കാലത്ത് അത്തപൂക്കളം ഇടുന്നതും, [breathes] ഊഞ്ഞാലാടുന്നതും, ഓണസദ്യ കഴിക്കുന്നതും കുടുംബക്കാർടെ എല്ലാവർടെം കൂടെ"
  },
  {
    "index": 21,
    "start_time": 96.5,
    "end_time": 99.8,
    "text": "{uhh} ഒരു ഒരുമിച്ച് ഒത്തൊരുമ ആണല്ലോ ഓണമെന്ന് പറയുന്നത്."
  },
  {
    "index": 22,
    "start_time": 110.3,
    "end_time": 114.6,
    "text": "നമ്മൾ സ്ക്കൂളില് പഠിക്കുമ്പത്തേക്കും മാവേലി ആയിട്ടൊക്കെ വേഷം കെട്ടുന്നത് എന്തു രസവാണ്. [breathes] [happy]"
  },
  {
    "index": 23,
    "start_time": 114.9,
    "end_time": 115.6,
    "text": "ഓരോ [breathes]"
  },
  {
    "index": 24,
    "start_time": 116.1,
    "end_time": 116.5,
    "text": "അതെ"
  },
  {
    "index": 25,
    "start_time": 124.6,
    "end_time": 125.7,
    "text": "അതെ, സത്യമാ "
  },
  {
    "index": 26,
    "start_time": 130.6,
    "end_time": 133,
    "text": "എനിക്കീ പുലിക്കളിയൊക്കെ കാണാൻ ഭയങ്കര ഇഷ്ട്ടവാണ്."
  },
  {
    "index": 27,
    "start_time": 137.3,
    "end_time": 147.5,
    "text": "അതെ അതെ {umm} school കൾക്ക് miss ചെയുന്നു ശരിക്കും പറഞ്ഞാൽ. അവ {uhh} നമ്മൾ ആഘോഷിക്കുന്നതും ഒരുമിച്ച് അത്തപൂക്കളം ഇടുന്നതും [breathes] {uhh} മത്സരം വെയ്ക്കുന്നത് അത്തപൂക്കളത്തിന്റെ"
  },
  {
    "index": 28,
    "start_time": 147.7,
    "end_time": 148.3,
    "text": "അതൊക്കൊരു"
  },
  {
    "index": 29,
    "start_time": 150.1,
    "end_time": 151.7,
    "text": "അതേ, ഭയങ്കര നല്ലൊരു അനുഭവമാണ്."
  },
  {
    "index": 30,
    "start_time": 155.4,
    "end_time": 156,
    "text": "അതെ സത്യം"
  },
  {
    "index": 31,
    "start_time": 156.4,
    "end_time": 157.1,
    "text": "അതെയതെ"
  },
  {
    "index": 32,
    "start_time": 157.3,
    "end_time": 157.9,
    "text": "{uumm}"
  },
  {
    "index": 33,
    "start_time": 159,
    "end_time": 160,
    "text": "{umm} ശെരിയെടാ."
  }
]

Request Data

You can file a request to get access to the data.