Source code for pyreason.scripts.utils.yaml_parser

import yaml
import numba
import numpy as np

import pyreason.scripts.numba_wrapper.numba_types.interval_type as interval
import pyreason.scripts.numba_wrapper.numba_types.label_type as label
import pyreason.scripts.numba_wrapper.numba_types.rule_type as rule
import pyreason.scripts.numba_wrapper.numba_types.fact_node_type as fact_node
import pyreason.scripts.numba_wrapper.numba_types.fact_edge_type as fact_edge



[docs]
def parse_rules(path):
    with open(path, 'r') as file:
        rules_yaml = yaml.safe_load(file)

    rules = numba.typed.List.empty_list(rule.rule_type)
    immediate_rules = numba.typed.List.empty_list(rule.rule_type)
    for rule_name, values in rules_yaml.items():
        # Set rule target
        target = label.Label('')
        if values['target'] is not None:
            target = label.Label(values['target'])

        # Set delta t
        delta_t = numba.types.uint16(values['delta_t'])

        # neigh_criteria = [c1, c2, c3, c4]
        # thresholds = [t1, t2, t3, t4]

        # Array of thresholds to keep track of for each neighbor criterion. Form [(comparison, (number/percent, total/available), thresh)]
        thresholds = numba.typed.List.empty_list(numba.types.Tuple((numba.types.string, numba.types.UniTuple(numba.types.string, 2), numba.types.float64)))

        # Array to store clauses for nodes: node/edge, [subset]/[subset1, subset2], label, interval
        neigh_criteria = numba.typed.List.empty_list(numba.types.Tuple((numba.types.string, label.label_type, numba.types.UniTuple(numba.types.string, 2), interval.interval_type)))
        if values['neigh_criteria'] is not None:
            # Loop through clauses
            for clause in values['neigh_criteria']:

                # Append clause
                clause_type = clause[0]
                subset = (clause[1][0], clause[1][0]) if clause_type=='node' else (clause[1][0], clause[1][1])
                l = label.Label(clause[2])
                bnd = interval.closed(clause[3][0], clause[3][1])
                neigh_criteria.append((clause_type, l, subset, bnd))

                # Append threshold corresponding to clause if specified in rule, else use default of greater equal to 1
                if len(clause)>4:
                    quantifier = clause[4][0]
                    if clause[4][1]=='number':
                        quantifier_type = ('number', 'total')
                    else:
                        quantifier_type = ('percent', clause[4][1][1])
                    thresh = clause[4][2]
                else:
                    quantifier = 'greater_equal'
                    quantifier_type = ('number', 'total')
                    thresh = 1
                thresholds.append((quantifier, quantifier_type, thresh))

        # Edges that need to be added if rule fires
        edges = ('', '', label.Label(''))
        if 'edges' in values and values['edges']:
            if len(values['edges'])==2:
                e = values['edges'] + [label.Label('')]
                edges = tuple(e)
            elif len(values['edges'])==3:
                values['edges'][2] = label.Label(values['edges'][2])
                edges = tuple(values['edges'])

        # Both target and edge label (if edges are being added) cannot be '' at the same time. One has to have a value
        assert edges[2].get_value()!='' or target.get_value()!='', 'Both target and edge label cannot empty at the same time, one has to take a value. Modify the rules YAML file'

        # If annotation function is a string, it is the name of the function. If it is a bound then set it to an empty string
        ann_fn, ann_label = values['ann_fn']
        if isinstance(ann_fn, str):
            bnd = interval.closed(0, 1)
            ann_label = label.Label(ann_label)
        elif isinstance(ann_fn, (float, int)):
            bnd = interval.closed(values['ann_fn'][0], values['ann_fn'][1])
            ann_fn = ''
            ann_label = label.Label('')

        # If there are weights provided, store them. Default is [1,1,1...1,0]
        num_clauses = 0 if values['neigh_criteria'] is None else len(values['neigh_criteria'])
        weights = np.ones(num_clauses, dtype=np.float64)
        weights = np.append(weights, 0)
        if 'weights' in values and values['weights']:
            weights = np.array(values['weights'], dtype=np.float64)

        # Immediate rule flag -- whether to be applied before all other rules
        immediate_rule = False
        if 'immediate' in values and values['immediate'] is not None:
            immediate_rule = True

        # Dummy rule type. this file is deprecated
        r = rule.Rule(rule_name, 'node', target, delta_t, neigh_criteria, bnd, thresholds, ann_fn, ann_label, weights, edges, immediate_rule)

        # Insert to beginning of list if flag for immediate rule is true
        if immediate_rule:
            immediate_rules.append(r)
        else:
            rules.append(r)

    all_rules = numba.typed.List.empty_list(rule.rule_type)
    all_rules.extend(immediate_rules)
    all_rules.extend(rules)
    return all_rules




[docs]
def parse_facts(path, reverse):
    with open(path, 'r') as file:
        facts_yaml = yaml.safe_load(file)

    facts_node = numba.typed.List.empty_list(fact_node.fact_type)
    if facts_yaml['nodes'] is not None:
        for fact_name, values in facts_yaml['nodes'].items():
            n = str(values['node'])
            l = label.Label(values['label'])
            bound = interval.closed(values['bound'][0], values['bound'][1])
            if values['static']:
                static = True
                t_lower = 0
                t_upper = 0
            else:
                static = False
                t_lower = values['t_lower']
                t_upper = values['t_upper']
            f = fact_node.Fact(fact_name, n, l, bound, t_lower, t_upper, static)
            facts_node.append(f)

    facts_edge = numba.typed.List.empty_list(fact_edge.fact_type)
    if facts_yaml['edges'] is not None:
        for fact_name, values in facts_yaml['edges'].items():
            e = (str(values['source']), str(values['target'])) if not reverse else (str(values['target']), str(values['source']))
            l = label.Label(values['label'])
            bound = interval.closed(values['bound'][0], values['bound'][1])
            if values['static']:
                static = True
                t_lower = 0
                t_upper = 0
            else:
                static = False
                t_lower = values['t_lower']
                t_upper = values['t_upper']
            f = fact_edge.Fact(fact_name, e, l, bound, t_lower, t_upper, static)
            facts_edge.append(f)

    return facts_node, facts_edge




[docs]
def parse_labels(path):
    with open(path, 'r') as file:
        labels_yaml = yaml.safe_load(file)

    node_labels = numba.typed.List.empty_list(label.label_type)
    edge_labels = numba.typed.List.empty_list(label.label_type)
    if labels_yaml['node_labels'] is not None:
        for label_name in labels_yaml['node_labels']:
            l = label.Label(label_name)
            node_labels.append(l)

    if labels_yaml['edge_labels'] is not None:
        for label_name in labels_yaml['edge_labels']:
            l = label.Label(label_name)
            edge_labels.append(l)

    # Add an edge label for each edge
    edge_labels.append(label.Label('edge'))

    specific_node_labels = numba.typed.Dict.empty(key_type=label.label_type, value_type=numba.types.ListType(numba.types.string))
    if labels_yaml['node_specific_labels'] is not None:
        for entry in labels_yaml['node_specific_labels']:
            for label_name, nodes in entry.items():
                l = label.Label(str(label_name))
                specific_node_labels[l] = numba.typed.List([str(n) for n in nodes])

    specific_edge_labels = numba.typed.Dict.empty(key_type=label.label_type, value_type=numba.types.ListType(numba.types.Tuple((numba.types.string, numba.types.string))))
    if labels_yaml['edge_specific_labels'] is not None:
        for entry in labels_yaml['edge_specific_labels']:
            for label_name, edges in entry.items():
                l = label.Label(str(label_name))
                specific_edge_labels[l] = numba.typed.List([(str(e[0]), str(e[1])) for e in edges])

    return node_labels, edge_labels, specific_node_labels, specific_edge_labels




[docs]
def parse_ipl(path):
    with open(path, 'r') as file:
        ipl_yaml = yaml.safe_load(file)

    ipl = numba.typed.List.empty_list(numba.types.Tuple((label.label_type, label.label_type)))
    if ipl_yaml['ipl'] is not None:
        for labels in ipl_yaml['ipl']:
            ipl.append((label.Label(labels[0]), label.Label(labels[1])))

    return ipl