fix: corner case for x87 context restore on execve
[lunaix-os.git] / lunaix-os / kernel / asm / x86 / pfault.c
1 #include <arch/x86/interrupts.h>
2 #include <lunaix/common.h>
3 #include <lunaix/mm/mm.h>
4 #include <lunaix/mm/pmm.h>
5 #include <lunaix/mm/region.h>
6 #include <lunaix/mm/vmm.h>
7 #include <lunaix/sched.h>
8 #include <lunaix/signal.h>
9 #include <lunaix/status.h>
10 #include <lunaix/syslog.h>
11
12 #include <klibc/string.h>
13
14 static u32_t
15 get_ptattr(struct mm_region* vmr)
16 {
17     u32_t vmr_attr = vmr->attr;
18     u32_t ptattr = PG_PRESENT | PG_ALLOW_USER;
19
20     if ((vmr_attr & PROT_WRITE)) {
21         ptattr |= PG_WRITE;
22     }
23
24     return ptattr & 0xfff;
25 }
26
27 static void
28 kprintf(const char* fmt, ...)
29 {
30     va_list args;
31     va_start(args, fmt);
32     __kprintf("PFAULT", fmt, args);
33     va_end(args);
34 }
35
36 #define COW_MASK (REGION_RSHARED | REGION_READ | REGION_WRITE)
37
38 extern void
39 __print_panic_msg(const char* msg, const isr_param* param);
40
41 void
42 intr_routine_page_fault(const isr_param* param)
43 {
44     uint32_t errcode = param->execp->err_code;
45     ptr_t ptr = cpu_rcr2();
46     if (!ptr) {
47         goto segv_term;
48     }
49
50     v_mapping mapping;
51     if (!vmm_lookup(ptr, &mapping)) {
52         goto segv_term;
53     }
54
55     if (!SEL_RPL(param->execp->cs)) {
56         // TODO if kernel pfault
57     }
58
59     vm_regions_t* vmr = (vm_regions_t*)&__current->mm.regions;
60     struct mm_region* hit_region = region_get(vmr, ptr);
61
62     if (!hit_region) {
63         // 当你凝视深渊时……
64         goto segv_term;
65     }
66
67     volatile x86_pte_t* pte = &PTE_MOUNTED(VMS_SELF, ptr >> 12);
68     if (PG_IS_PRESENT(*pte)) {
69         if (((errcode ^ mapping.flags) & PG_ALLOW_USER)) {
70             // invalid access
71             kprintf(KDEBUG "invalid user access. (%p->%p, attr:0x%x)\n",
72                     mapping.va,
73                     mapping.pa,
74                     mapping.flags);
75             goto segv_term;
76         }
77         if ((hit_region->attr & COW_MASK) == COW_MASK) {
78             // normal page fault, do COW
79             cpu_invplg((ptr_t)pte);
80
81             ptr_t pa = (ptr_t)vmm_dup_page(__current->pid, PG_ENTRY_ADDR(*pte));
82
83             pmm_free_page(__current->pid, *pte & ~0xFFF);
84             *pte = (*pte & 0xFFF & ~PG_DIRTY) | pa | PG_WRITE;
85
86             goto resolved;
87         }
88         // impossible cases or accessing privileged page
89         goto segv_term;
90     }
91
92     // an anonymous page and not present
93     //   -> a new page need to be alloc
94     if ((hit_region->attr & REGION_ANON)) {
95         if (!PG_IS_PRESENT(*pte)) {
96             cpu_invplg((ptr_t)pte);
97
98             ptr_t pa = pmm_alloc_page(__current->pid, 0);
99             if (!pa) {
100                 goto oom;
101             }
102
103             *pte = *pte | pa | get_ptattr(hit_region);
104             memset((void*)PG_ALIGN(ptr), 0, PG_SIZE);
105             goto resolved;
106         }
107         // permission denied on anon page (e.g., write on readonly page)
108         goto segv_term;
109     }
110
111     // if mfile is set (Non-anonymous), then it is a mem map
112     if (hit_region->mfile && !PG_IS_PRESENT(*pte)) {
113         struct v_file* file = hit_region->mfile;
114
115         ptr = PG_ALIGN(ptr);
116
117         u32_t mseg_off = (ptr - hit_region->start);
118         u32_t mfile_off = mseg_off + hit_region->foff;
119         ptr_t pa = pmm_alloc_page(__current->pid, 0);
120
121         if (!pa) {
122             goto oom;
123         }
124
125         cpu_invplg((ptr_t)pte);
126         *pte = (*pte & 0xFFF) | pa | get_ptattr(hit_region);
127
128         memset((void*)ptr, 0, PG_SIZE);
129
130         int errno = 0;
131         if (mseg_off < hit_region->flen) {
132             errno =
133               file->ops->read_page(file->inode, (void*)ptr, PG_SIZE, mfile_off);
134         }
135
136         if (errno < 0) {
137             kprintf(KERROR "fail to populate page (%d)\n", errno);
138             goto segv_term;
139         }
140
141         *pte &= ~PG_DIRTY;
142
143         goto resolved;
144     }
145
146     // page not present, might be a chance to introduce swap file?
147     __print_panic_msg("WIP page fault route", param);
148     while (1)
149         ;
150
151 oom:
152     kprintf(KERROR "out of memory\n");
153
154 segv_term:
155     kprintf(KERROR "(pid: %d) Segmentation fault on %p (%p:%p,e=0x%x)\n",
156             __current->pid,
157             ptr,
158             param->execp->cs,
159             param->execp->eip,
160             param->execp->err_code);
161
162     sigset_add(__current->sigctx.sig_pending, _SIGSEGV);
163
164     schedule();
165     // should not reach
166     while (1)
167         ;
168
169 resolved:
170     cpu_invplg(ptr);
171     return;
172 }