character-level-language-model

Here are 19 public repositories matching this topic...

Anwarvic / Arabic-Tashkeela-Model

This is a diacritization model for Arabic language. This model was built/trained using the Tashkeela: the Arabic diacritization corpus on Kaggle

nlp arabic-nlp hmm-model arabic-diacritics character-level-language-model tashkeela-model

Updated Sep 10, 2023
Python

clovaai / group-transformer

Star

Official code for Group-Transformer (Scale down Transformer by Grouping Features for a Lightweight Character-level Language Model, COLING-2020).

lightweight language-modeling pytorch character-level-language-model

Updated Dec 30, 2020
Python

A structured documentation hub for AI and ML concepts, based on Andrej Karpathy's 'Zero to Hero' series, featuring practical implementations and learning resources for language models and transformers.

documentation machine-learning python3 pytorch artificial-intelligence neural-networks gpt language-model character-level-language-model

Updated Oct 7, 2025

Sangarshanan / song-lyrics-generation-and-analysis

Star

Lyrics Generation:notes: using LSTM , word2vec Analysis and more

word2vec plotly lstm rap-lyrics character-level-language-model word-level-lstm

Updated Jun 7, 2018
Jupyter Notebook

tejaslodaya / character-level-language-model

Star

Build a character level language model to generate new dinosaur names

numpy rnn language-model dinosaurs character-level-language-model

Updated Feb 15, 2018
Python

susantabiswas / Article-Generator

Star

Text Article generator using using Character level LSTM network.

text-generation lstm rnn character-level-rnn character-level-language-model

Updated Mar 6, 2018
Python

razormin / Sequence-Models

Star

Sequence Models coding assignments

transformers neural-machine-translation sequence-models recurrent-neural-network character-level-language-model lstm-network trigger-word-detection word-vector-representation

Updated Jun 30, 2021
Jupyter Notebook

explanare / char-iit

Star

A causal intervention framework to learn robust and interpretable character representations inside subword-based language models

subword interpretability character-level-language-model causal-intervention

Updated Jul 10, 2023
Jupyter Notebook

MUHAMMADAKMAL137 / IMDB-Dataset-Classification-using-Pre-trained-Word-Embedding-with-GloVec-6B

Star

In this project, I worked with a small corpus consisting of simple sentences. I tokenized the words using n-grams from the NLTK library and performed word-level and character-level one-hot encoding. Additionally, I utilized the Keras Tokenizer to tokenize the sentences and implemented word embedding using the Embedding layer. For sentiment analysis

word-embeddings corpus seq2seq ngrams character-level character-level-language-model word-level-language-model one-hot-encoding pre-trained-word-embedding pre-trained-glove-6b word-level

Updated Aug 1, 2023
Jupyter Notebook

sjmiller8182 / character-convolutions-classification

Star

An implementation of "Character-level Convolutional Networks for Text Classification" in Tensorflow. See https://arxiv.org/pdf/1509.01626.pdf.

nlp natural-language-processing natural-language-understanding paper-implementations character-level-cnn character-level-language-model character-convolutional-models

Updated Aug 11, 2020
Python

Subangkar / Sequence-Models-Deeplearning.ai-Coursera-Assignments

Star

Notebooks of programming assignments of Sequence Models course of deeplearning.ai on coursera in May-2020

word2vec word-embeddings language-modeling lstm rnn neural-machine-translation rnn-model sequence-models coursera-assignment attention-model brnn andrew-ng-course deeplearning-ai character-level-language-model trigger-word-detection lstm-sentiment-classification emojify-text

Updated May 2, 2020
Jupyter Notebook

Kiminjo / Character-level-language-model

Star

It aims to write new sentences by learning character units sentences using RNN. As training data, a collection of Shakespeare's novels was used.

nlp lstm rnn rnn-pytorch character-level-language-model

Updated Nov 3, 2021
Python

0xnu / tipus-micro-llm

Sponsor

Star

Character-level and token-based language models implemented in pure PyTorch.

open-source character-level-language-model large-language-models llm large-language-model llm-training llm-inference token-based-language-model

Updated Aug 23, 2025
Jupyter Notebook

surrey-nlp / PLODv2-CLM4AbbrDetection

Star

This repository contains the code and PLODv2 dataset to train character-level language models (CLM) for abbreviation and long-form detection released with our LREC-COLING 2024 publication

natural-language-processing datasets sequence-labeling character-level-language-model abbreviations-detection