medcat.components.addons.meta_cat.models

Classes:

BertForMetaAnnotation –
LSTM –

Attributes:

logger –

logger `module-attribute`

logger = getLogger(__name__)

BertForMetaAnnotation

BertForMetaAnnotation(config: ConfigMetaCAT, save_dir_path: Optional[str] = None)

Bases: Module

Methods:

forward –

Args:

Attributes:

bert –
bert_config –
config –
dropout –
fc1 –
fc2 –
fc3 –
fc4 –
num_labels –
relu –
softmax –

Source code in medcat-v2/medcat/components/addons/meta_cat/models.py

def __init__(self, config: ConfigMetaCAT,
             save_dir_path: Optional[str] = None):
    super(BertForMetaAnnotation, self).__init__()
    if save_dir_path:
        try:
            _bertconfig = AutoConfig.from_pretrained(
                save_dir_path + "/bert_config.json",
                num_hidden_layers=config.model.num_layers)
        except Exception as e:
            _bertconfig = AutoConfig.from_pretrained(
                config.model.model_variant,
                num_hidden_layers=config.model.num_layers)
            logger.info("BERT config not found locally — "
                        "downloaded successfully from Hugging Face.")
            raise e
    else:
        _bertconfig = AutoConfig.from_pretrained(
            config.model.model_variant,
            num_hidden_layers=config.model.num_layers)

    if config.model.input_size != _bertconfig.hidden_size:
        logger.warning(
            "Input size for %s model should be %d, provided input size is "
            "%d. Input size changed to %d", config.model.model_variant,
            _bertconfig.hidden_size, config.model.input_size,
            _bertconfig.hidden_size)

    try:
        bert = BertModel.from_pretrained(
            config.model.model_variant,
            config=_bertconfig)
    except Exception as e:
        bert = BertModel(_bertconfig)
        if save_dir_path:
            logger.info(
                "Could not load BERT pretrained weights from Hugging Face."
                " BERT model was loaded with random weights.\n"
                "This will work the weights will be loaded off disk.")
        else:
            logger.warning(
                "Could not load BERT pretrained weights from Hugging Face."
                " BERT model was loaded with random weights.\n"
                "DO NOT use this model without loading the model state!",
                exc_info=e)

    self._config = config
    self.bert = bert
    # NOTE: potentially used downstream
    self.config = self.bert_config = _bertconfig
    self.num_labels = config.model.nclasses
    for param in self.bert.parameters():
        param.requires_grad = not config.model.model_freeze_layers

    hidden_size_2 = int(config.model.hidden_size / 2)
    # dropout layer
    self.dropout = nn.Dropout(config.model.dropout)
    # relu activation function
    self.relu = nn.ReLU()
    # dense layer 1
    self.fc1 = nn.Linear(_bertconfig.hidden_size * 2,
                         config.model.hidden_size)
    # dense layer 2
    self.fc2 = nn.Linear(config.model.hidden_size, hidden_size_2)
    # dense layer 3
    self.fc3 = nn.Linear(hidden_size_2, hidden_size_2)
    # dense layer 3 (Output layer)
    model_arch_config = config.model.model_architecture_config

    if (model_arch_config['fc3'] is True and
            model_arch_config['fc2'] is False):
        logger.warning("FC3 can only be used if FC2 is also enabled. "
                       "Enabling FC2...")
        config.model.model_architecture_config['fc2'] = True

    if model_arch_config is not None:
        if model_arch_config['fc2'] is True:
            self.fc4 = nn.Linear(hidden_size_2, self.num_labels)
        else:
            self.fc4 = nn.Linear(config.model.hidden_size, self.num_labels)
    else:
        self.fc4 = nn.Linear(hidden_size_2, self.num_labels)
    # softmax activation function
    self.softmax = nn.LogSoftmax(dim=1)

bert `instance-attribute`

bert = bert

bert_config `instance-attribute`

bert_config = _bertconfig

config `instance-attribute`

config = _bertconfig

dropout `instance-attribute`

dropout = Dropout(dropout)

fc1 `instance-attribute`

fc1 = Linear(hidden_size * 2, hidden_size)

fc2 `instance-attribute`

fc2 = Linear(hidden_size, hidden_size_2)

fc3 `instance-attribute`

fc3 = Linear(hidden_size_2, hidden_size_2)

fc4 `instance-attribute`

fc4 = Linear(hidden_size_2, num_labels)

num_labels `instance-attribute`

num_labels = nclasses

relu `instance-attribute`

relu = ReLU()

softmax `instance-attribute`

softmax = LogSoftmax(dim=1)

forward

forward(input_ids: Optional[LongTensor] = None, attention_mask: Optional[FloatTensor] = None, token_type_ids: Optional[LongTensor] = None, position_ids: Optional[LongTensor] = None, head_mask: Optional[FloatTensor] = None, inputs_embeds: Optional[FloatTensor] = None, labels: Optional[LongTensor] = None, center_positions: Iterable[Any] = [], ignore_cpos: Optional[bool] = None, output_attentions: Optional[bool] = None, output_hidden_states: Optional[bool] = None, return_dict: Optional[bool] = None)

Parameters:

input_ids
(Optional[LongTensor], default: None ) –

The input IDs. Defaults to None.
attention_mask
(Optional[FloatTensor], default: None ) –

The attention mask. Defaults to None.
token_type_ids
(Optional[LongTensor], default: None ) –

Type IDs of the tokens. Defaults to None.
position_ids
(Optional[LongTensor], default: None ) –

Position IDs. Defaults to None.
head_mask
(Optional[FloatTensor], default: None ) –

Head mask. Defaults to None.
inputs_embeds
(Optional[FloatTensor], default: None ) –

Input embeddings. Defaults to None.
labels
(Optional[LongTensor], default: None ) –

Labels for computing the token classification loss. Indices should be in [0, ..., config.num_labels - 1]. Defaults to None.
center_positions
(Optional[Any], default: [] ) –

Cennter positions. Defaults to None.
output_attentions
(Optional[bool], default: None ) –

Output attentions. Defaults to None.
ignore_cpos
(Optional[bool], default: None ) –

If center positions are to be ignored.
output_hidden_states
(Optional[bool], default: None ) –

Output hidden states. Defaults to None.
return_dict
(Optional[bool], default: None ) –

Whether to return a dict. Defaults to None.

Returns:

TokenClassifierOutput –

The token classifier output.

Source code in medcat-v2/medcat/components/addons/meta_cat/models.py

def forward(
        self,
        input_ids: Optional[torch.LongTensor] = None,
        attention_mask: Optional[torch.FloatTensor] = None,
        token_type_ids: Optional[torch.LongTensor] = None,
        position_ids: Optional[torch.LongTensor] = None,
        head_mask: Optional[torch.FloatTensor] = None,
        inputs_embeds: Optional[torch.FloatTensor] = None,
        labels: Optional[torch.LongTensor] = None,
        center_positions: Iterable[Any] = [],
        ignore_cpos: Optional[bool] = None,
        output_attentions: Optional[bool] = None,
        output_hidden_states: Optional[bool] = None,
        return_dict: Optional[bool] = None
):
    """

    Args:
        input_ids (Optional[torch.LongTensor]):
            The input IDs. Defaults to None.
        attention_mask (Optional[torch.FloatTensor]):
            The attention mask. Defaults to None.
        token_type_ids (Optional[torch.LongTensor]):
            Type IDs of the tokens. Defaults to None.
        position_ids (Optional[torch.LongTensor]):
            Position IDs. Defaults to None.
        head_mask (Optional[torch.FloatTensor]):
            Head mask. Defaults to None.
        inputs_embeds (Optional[torch.FloatTensor]):
            Input embeddings. Defaults to None.
        labels (Optional[torch.LongTensor]):
            Labels for computing the token classification loss. Indices
            should be in `[0, ..., config.num_labels - 1]`.
            Defaults to None.
        center_positions (Optional[Any]): Cennter positions.
            Defaults to None.
        output_attentions (Optional[bool]): Output attentions.
            Defaults to None.
        ignore_cpos:
            If center positions are to be ignored.
        output_hidden_states (Optional[bool]):
            Output hidden states. Defaults to None.
        return_dict (Optional[bool]):
            Whether to return a dict. Defaults to None.

    Returns:
        TokenClassifierOutput: The token classifier output.
    """

    outputs = self.bert(  # type: ignore
        input_ids,
        attention_mask=attention_mask, output_hidden_states=True
    )

    x_all = []
    for i, indices in enumerate(center_positions):
        this_hidden: torch.Tensor = outputs.last_hidden_state[
            i, indices, :]
        to_append, _ = torch.max(this_hidden, dim=0)
        x_all.append(to_append)

    x = torch.stack(x_all)

    pooled_output = outputs[1]
    x = torch.cat((x, pooled_output), dim=1)

    # fc1
    x = self.dropout(x)
    x = self.fc1(x)
    x = self.relu(x)

    if self._config.model.model_architecture_config is not None:
        if self._config.model.model_architecture_config['fc2'] is True:
            # fc2
            x = self.fc2(x)
            x = self.relu(x)
            x = self.dropout(x)

            if self._config.model.model_architecture_config['fc3'] is True:
                # fc3
                x = self.fc3(x)
                x = self.relu(x)
                x = self.dropout(x)
    else:
        # fc2
        x = self.fc2(x)
        x = self.relu(x)
        x = self.dropout(x)

        # fc3
        x = self.fc3(x)
        x = self.relu(x)
        x = self.dropout(x)

    # output layer
    x = self.fc4(x)
    return x

LSTM

LSTM(embeddings: Optional[Tensor], config: ConfigMetaCAT)

Bases: Module

Methods:

forward –

Attributes:

config –
d1 –
embeddings –
fc1 –
rnn –

Source code in medcat-v2/medcat/components/addons/meta_cat/models.py

def __init__(self, embeddings: Optional[Tensor], config: ConfigMetaCAT
             ) -> None:
    super(LSTM, self).__init__()

    self.config = config
    # Get the required sizes
    vocab_size = config.general.vocab_size
    embedding_size = config.model.input_size

    # Initialize embeddings
    self.embeddings = nn.Embedding(vocab_size, embedding_size,
                                   padding_idx=config.model.padding_idx)
    if embeddings is not None:
        self.embeddings.load_state_dict(OrderedDict(
            [('weight', embeddings)]))
        # Disable training for the embeddings - IMPORTANT
        self.embeddings.weight.requires_grad = config.model.emb_grad

    # Create the RNN cell - divide
    self.rnn = nn.LSTM(
        input_size=config.model.input_size,
        hidden_size=(config.model.hidden_size //
                     config.model.num_directions),
        num_layers=config.model.num_layers,
        dropout=config.model.dropout,
        bidirectional=config.model.num_directions == 2)
    self.fc1 = nn.Linear(config.model.hidden_size, config.model.nclasses)

    self.d1 = nn.Dropout(config.model.dropout)

config `instance-attribute`

config = config

d1 `instance-attribute`

d1 = Dropout(dropout)

embeddings `instance-attribute`

embeddings = Embedding(vocab_size, embedding_size, padding_idx=padding_idx)

fc1 `instance-attribute`

fc1 = Linear(hidden_size, nclasses)

rnn `instance-attribute`

rnn = LSTM(input_size=input_size, hidden_size=hidden_size // num_directions, num_layers=num_layers, dropout=dropout, bidirectional=num_directions == 2)

forward

forward(input_ids: LongTensor, center_positions: Tensor, attention_mask: Optional[FloatTensor] = None, ignore_cpos: bool = False) -> Tensor

Source code in medcat-v2/medcat/components/addons/meta_cat/models.py

def forward(self,
            input_ids: torch.LongTensor,
            center_positions: Tensor,
            attention_mask: Optional[torch.FloatTensor] = None,
            ignore_cpos: bool = False) -> Tensor:
    x = input_ids
    # Get the mask from x
    if attention_mask is None:
        mask = x != self.config.model.padding_idx
    else:
        mask = attention_mask

    # Embed the input: from id -> vec
    # x.shape = batch_size x sequence_length x emb_size
    x = self.embeddings(x)

    # Tell RNN to ignore padding and set the batch_first to True
    x2 = nn.utils.rnn.pack_padded_sequence(
        x, mask.sum(1).int().view(-1).cpu(), batch_first=True,
        enforce_sorted=False)

    # Run 'x' through the RNN
    x3, hidden = self.rnn(x2)

    # Add the padding again
    x4, _ = torch.nn.utils.rnn.pad_packed_sequence(x3, batch_first=True)

    # Get what we need
    # row_indices = torch.arange(0, x.size(0)).long()

    # If this is  True we will always take the last state and not CPOS
    if ignore_cpos:
        x4 = hidden[0]
        x4 = x4.view(
            self.config.model.num_layers,
            self.config.model.num_directions, -1,
            (self.config.model.hidden_size //
             self.config.model.num_directions))
        x4 = x4[-1, :, :, :].permute(1, 2, 0).reshape(
            -1, self.config.model.hidden_size)
    else:
        x_all = []
        for i, indices in enumerate(center_positions):
            this_hidden = x4[i, indices, :]
            to_append, _ = torch.max(this_hidden, dim=0)
            x_all.append(to_append)

        x4 = torch.stack(x_all)

    # Push x through the fc network and add dropout
    x5 = self.d1(x4)
    x6 = self.fc1(x5)

    return x6

medcat.components.addons.meta_cat.models

logger `module-attribute`

BertForMetaAnnotation

bert `instance-attribute`

bert_config `instance-attribute`

config `instance-attribute`

dropout `instance-attribute`

fc1 `instance-attribute`

fc2 `instance-attribute`

fc3 `instance-attribute`

fc4 `instance-attribute`

num_labels `instance-attribute`

relu `instance-attribute`

softmax `instance-attribute`

forward

`input_ids`

`attention_mask`

`token_type_ids`

`position_ids`

`head_mask`

`inputs_embeds`

`labels`

`center_positions`

`output_attentions`

`ignore_cpos`

`output_hidden_states`

`return_dict`

LSTM

config `instance-attribute`

d1 `instance-attribute`

embeddings `instance-attribute`

fc1 `instance-attribute`

rnn `instance-attribute`

forward

medcat.components.addons.meta_cat.models

logger module-attribute

BertForMetaAnnotation

bert instance-attribute

bert_config instance-attribute

config instance-attribute

dropout instance-attribute

fc1 instance-attribute

fc2 instance-attribute

fc3 instance-attribute

fc4 instance-attribute

num_labels instance-attribute

relu instance-attribute

softmax instance-attribute

forward

input_ids

attention_mask

token_type_ids

position_ids

head_mask

inputs_embeds

labels

center_positions

output_attentions

ignore_cpos

output_hidden_states

return_dict

LSTM

config instance-attribute

d1 instance-attribute

embeddings instance-attribute

fc1 instance-attribute

rnn instance-attribute

forward

logger `module-attribute`

bert `instance-attribute`

bert_config `instance-attribute`

config `instance-attribute`

dropout `instance-attribute`

fc1 `instance-attribute`

fc2 `instance-attribute`

fc3 `instance-attribute`

fc4 `instance-attribute`

num_labels `instance-attribute`

relu `instance-attribute`

softmax `instance-attribute`

`input_ids`

`attention_mask`

`token_type_ids`

`position_ids`

`head_mask`

`inputs_embeds`

`labels`

`center_positions`

`output_attentions`

`ignore_cpos`

`output_hidden_states`

`return_dict`

config `instance-attribute`

d1 `instance-attribute`

embeddings `instance-attribute`

fc1 `instance-attribute`

rnn `instance-attribute`